Δείτε τι κάνει το Sora, το νέο εργαλείο της OpenAI
Ακολουθήστε μας στο Linkedin και συνδεθείτε με άλλους επαγγελματίες του κλάδου
Η OpenAI, πρωτοπόρος στον τομέα της τεχνητής νοημοσύνης, παρουσιάζει το Sora, το νέο εργαλείο text-to-video που έχει σκοπό να αλλάξει τον τρόπο με τον οποίο δημιουργούμε και αντιλαμβανόμαστε το βίντεο.
Το Sora, που αναμένεται να ενσωματωθεί στα προϊόντα της OpenAI, μπορεί να παράγει βίντεο μέχρι ενός λεπτού διάρκειας διατηρώντας την οπτική ποιότητα και εκπληρώνοντας τις οδηγίες των χρηστών.
Η τεχνολογία πίσω από το Sοra αποκαλύπτει την ικανότητα της AI να αναπαριστά και να προσομοιώνει σύνθετες σκηνές με πολλαπλούς χαρακτήρες, ειδικούς τύπους κίνησης και ακριβείς λεπτομέρειες του θέματος και του φόντου.
Το Sοra κατανοεί όχι μόνο τι ζητά ο χρήστης, αλλά και πώς αυτά τα στοιχεία υφίστανται στον φυσικό κόσμο.
Ωστόσο, το εργαλείο αντιμετωπίζει και προκλήσεις, καθώς μπορεί να δυσκολευτεί να προσομοιώσει ακριβώς τη φυσική κίνηση μιας περίπλοκης σκηνής ή να κατανοήσει συγκεκριμένες περιπτώσεις αιτίας και αποτελέσματος.
Ασφάλεια και Έρευνα
Πριν το Sοra καταστεί διαθέσιμο στα προϊόντα της OpenAI, η εταιρεία λαμβάνει σημαντικά μέτρα ασφαλείας, συνεργαζόμενη με ειδικούς που θα δοκιμάσουν ανταγωνιστικά το μοντέλο για τυχόν κινδύνους ή βλάβες. Επιπλέον, αναπτύσσονται εργαλεία για την ανίχνευση παραπλανητικού περιεχομένου, όπως ένας ανιχνευτής ταξινόμησης ο οποίος θα επιβεβαιώνει εάν το υλικό έχει δημιουργηθεί με το Sοra ή όχι.
Παράλληλα, η OpenAI λαμβάνει τα μέτρα της προκειμένου να αποτραπεί η χρήση του εργαλείου για παραπληροφόρηση, επιβλαβές περιεχόμενο ή περιεχόμενο μίσους, σκηνές που προσομοιάζουν βία και άλλα.
Η εταιρεία εκτός από την ανάπτυξη νέων τεχνικών αξιοποιεί και υπάρχουσες μεθόδους ασφαλείας που έχουν αναπτυχθεί για το DALL·E 3, ενώ στο μέλλον αναμένεται να συμπεριληφθούν και C2PA metadata εάν αναπτυχθεί το Sora σε ένα προϊόν της ΟpenAI .
Τεχνικές Έρευνας
Το Sοra χρησιμοποιεί μια αρχιτεκτονική διάχυσης, ξεκινώντας με ένα βίντεο που μοιάζει με στατικό θόρυβο και σταδιακά το μετασχηματίζει αφαιρώντας τον θόρυβο. Αυτή η τεχνική, σε συνδυασμό με την αρχιτεκτονική transformer, προσφέρει στο Sοra τη δυνατότητα να παράγει ολόκληρα βίντεο με εξαιρετική ακρίβεια και λεπτομέρεια.
Το Sοra αποτελεί βάση για μοντέλα που μπορούν να κατανοήσουν και να προσομοιώσουν τον πραγματικό κόσμο, ένα βήμα που η ΟpenAI θεωρεί σημαντικό για την επίτευξη της Γενικής Τεχνητής Νοημοσύνης (AGI).
Η ΟpenAI είναι δεσμευμένη στην ανάπτυξη αυτής της τεχνολογίας με ασφάλεια και ηθική, εργαζόμενη στενά με πολιτικούς φορείς, εκπαιδευτικούς και καλλιτέχνες παγκοσμίως για να κατανοήσει τις ανησυχίες τους και να εντοπίσει θετικές χρήσεις αυτής της νέας τεχνολογίας. Παρά την εκτεταμένη έρευνα και δοκιμή, η ΟpenAI αναγνωρίζει ότι η πραγματική χρήση είναι κρίσιμη για την ανάπτυξη και την κυκλοφορία ασφαλέστερων συστημάτων ΤΝ με την πάροδο του χρόνο.
Δείτε περισσότερα: openai.com/sora