Η OpenAI, η δημιουργός του ChatGPT, παρουσίασε μια νέα μορφή τεχνητής νοημοσύνης που δημιουργεί ρεαλιστικά βίντεο με βάση προτροπές κειμένου, προκαλώντας συγκλονιστικές αντιδράσεις στο διαδίκτυο.
Το μοντέλο μετατροπής κειμένου σε βίντεο, που ονομάζεται Sora, έχει “βαθιά κατανόηση της γλώσσας” και μπορεί να δημιουργήσει “συναρπαστικούς χαρακτήρες που εκφράζουν ζωντανά συναισθήματα”, ανέφερε η OpenAI σε ανάρτηση στο blog της την Πέμπτη.
“Το Sora είναι σε θέση να δημιουργεί σύνθετες σκηνές με πολλούς χαρακτήρες, συγκεκριμένους τύπους κίνησης και ακριβείς λεπτομέρειες του θέματος και του φόντου”, δήλωσε η νεοσύστατη εταιρεία που υποστηρίζεται από τη Microsoft.
“Το μοντέλο καταλαβαίνει όχι μόνο τι έχει ζητήσει ο χρήστης στην προτροπή, αλλά και πώς αυτά τα πράγματα υπάρχουν στον φυσικό κόσμο”.
Ο διευθύνων σύμβουλος της OpenAI Sam Altman στο X κάλεσε τους χρήστες να προτείνουν προτροπές για το Sora πριν δημοσιεύσει αποτελέσματα που περιλάμβαναν ρεαλιστικά βίντεο με δύο γκόλντεν ριτρίβερ να κάνουν podcast στην κορυφή ενός βουνού, μια γιαγιά να φτιάχνει νιόκι και θαλάσσια ζώα να συμμετέχουν σε ποδηλατοδρομία στην κορυφή του ωκεανού.
https://t.co/uCuhUPv51N pic.twitter.com/nej4TIwgaP
— Sam Altman (@sama) February 15, 2024
Η υπερρεαλιστική ποιότητα των βίντεο προκάλεσε συγκλονιστικές αντιδράσεις στα μέσα κοινωνικής δικτύωσης, με τους χρήστες να χαρακτηρίζουν τα αποτελέσματα “εξωπραγματικά” και “game changer”.
“Έχουν περάσει δύο ώρες και ο εγκέφαλός μου ακόμα δεν μπορεί να επεξεργαστεί αυτά τα παραγόμενα βίντεο OpenAI Sora”, δήλωσε ο χρήστης του X Allen T.
Η διαδήλωση προώθησε επίσης τις ανησυχίες για πιθανούς κινδύνους, ιδίως σε μια χρονιά εκλογών που παρακολουθούνται στενά σε όλο τον κόσμο, συμπεριλαμβανομένων των προεδρικών εκλογών στις ΗΠΑ τον Νοέμβριο.
1) What https://t.co/w6b9T1WWue
— Sam Altman (@sama) February 15, 2024
https://t.co/qbj02M4ng8 pic.twitter.com/EvngqF2ZIX
— Sam Altman (@sama) February 15, 2024
https://t.co/SOUoXiSMBY pic.twitter.com/JB4zOjmbTp
— Sam Altman (@sama) February 15, 2024
Η OpenAI ανέφερε στην ανάρτησή της στο ιστολόγιό της ότι θα λάβει διάφορα σημαντικά μέτρα ασφαλείας πριν από την κυκλοφορία του Sora στο ευρύ κοινό.
“Συνεργαζόμαστε με red teamers – ειδικούς σε τομείς όπως η παραπληροφόρηση, το περιεχόμενο μίσους και η προκατάληψη – οι οποίοι θα δοκιμάσουν το μοντέλο με αντίπαλο τρόπο”, ανέφερε η εταιρεία.
“Κατασκευάζουμε επίσης εργαλεία που βοηθούν στον εντοπισμό παραπλανητικού περιεχομένου, όπως ένας ταξινομητής ανίχνευσης που μπορεί να καταλάβει πότε ένα βίντεο δημιουργήθηκε από το Sora”.
Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq
— OpenAI (@OpenAI) February 15, 2024
Το OpenAI αναγνώρισε επίσης ότι το Sora έχει αδυναμίες, συμπεριλαμβανομένης της δυσκολίας με τη συνέχεια και τη διάκριση αριστερά από δεξιά.
“Για παράδειγμα, ένα άτομο μπορεί να πάρει μια μπουκιά από ένα μπισκότο, αλλά μετά, το μπισκότο μπορεί να μην έχει σημάδι μπουκιάς”, δήλωσε η startup με έδρα το Σαν Φρανσίσκο.
Οι αντίπαλοι της OpenAI, η Meta και η Google, έχουν επίσης επιδείξει τεχνολογία τεχνητής νοημοσύνης από κείμενο σε βίντεο, αλλά τα μοντέλα τους δεν έχουν δώσει αποτελέσματα τόσο ρεαλιστικά όσο της Sora.
SORA is just out of this world.
OpenAI’s new text-to-video model just dropped and it’s insane.
More examples below ⬇️ pic.twitter.com/qbMy5Rz5Mc
— Linus (●ᴗ●) (@LinusEkenstam) February 15, 2024