Sora è il nuovo generatore di testo in video di OpenAI, produttore di ChatGPT. Ecco cosa sappiamo del nuovo strumento che suscita preoccupazione ed entusiasmo in egual misura.
Il creatore di ChatGPT si sta ora tuffando nel mondo dei video creati dall’intelligenza artificiale (AI).
Ti presentiamo Sora, il nuovo generatore di testo in video di OpenAI. Lo strumento, presentato giovedì dall’azienda con sede a San Francisco, utilizza l’intelligenza artificiale generativa per creare istantaneamente brevi video basati su comandi scritti.
Sora non è il primo a dimostrare questo tipo di tecnologia. Ma gli analisti del settore sottolineano l’alta qualità dei video dello strumento visualizzati finora e notano che la sua introduzione segna un passo avanti significativo sia per OpenAI che per il futuro della generazione di testo in video in generale.
Tuttavia, come per tutte le cose che riguardano oggi lo spazio dell’intelligenza artificiale in rapida crescita, tale tecnologia solleva anche timori su potenziali implicazioni etiche e sociali. Ecco cosa devi sapere
Cosa può fare Sora e posso già usarlo?
Sora è un generatore di testo in video che crea video lunghi fino a 60 secondi in base a istruzioni scritte utilizzando l’intelligenza artificiale generativa. Il modello può anche generare video da un’immagine fissa esistente.
L’intelligenza artificiale generativa è un ramo dell’intelligenza artificiale che può creare qualcosa di nuovo. Gli esempi includono chatbot, come ChatGPT di OpenAI, e generatori di immagini come DALL-E e Midjourney.
Ottenere un sistema di intelligenza artificiale per generare video è più nuovo e più impegnativo, ma si basa su alcune delle stesse tecnologie.
Sora non è ancora disponibile per l’uso pubblico (OpenAI afferma che sta collaborando con politici e artisti prima di rilasciare ufficialmente lo strumento) e ci sono ancora molte cose che non sappiamo. Ma dall’annuncio di giovedì, la società ha condiviso una manciata di esempi di video generati da Sora per mostrare cosa può fare.
Sam Altman, CEO di OpenAI si è rivolto anche a X, la piattaforma precedentemente nota come Twitter, per chiedere agli utenti dei social media di inviare idee tempestive.
In seguito ha condiviso video realistici e dettagliati che rispondevano a richieste come “due golden retriever che fanno podcast in cima a una montagna” e “una corsa ciclistica sull’oceano con diversi animali come atleti che guidano le biciclette con la telecamera di un drone”.
Sebbene i video generati da Sora possano rappresentare scene complesse e incredibilmente dettagliate, OpenAI nota che ci sono ancora alcuni punti deboli, inclusi alcuni elementi spaziali e di causa-effetto.
Ad esempio, OpenAI aggiunge sul suo sito web, “una persona potrebbe dare un morso a un biscotto, ma in seguito il cookie potrebbe non lasciare il segno del morso”.
Quali altri strumenti video generati dall’intelligenza artificiale sono disponibili?
Sora di OpenAI non è il primo del suo genere. Google, Meta e la startup Runway ML sono tra le aziende che hanno dimostrato una tecnologia simile.
Tuttavia, gli analisti del settore sottolineano la qualità apparente e la lunghezza impressionante dei video di Sora condivisi finora.
Fred Havemeyer, capo della ricerca statunitense sull’intelligenza artificiale e sul software presso Macquarie, ha affermato che il lancio di Sora segna un grande passo avanti per il settore.
“Non solo puoi realizzare video più lunghi, capisco fino a 60 secondi, ma anche i video creati sembrano più normali e sembrano rispettare di più la fisica e il mondo reale”, ha detto Havemeyer.
“Non ricevi tanti video di ‘Uncanny Valley’ o frammenti sui feed video che sembrano… innaturali”.
Sebbene ci siano stati “enormi progressi” nei video generati dall’intelligenza artificiale nell’ultimo anno – inclusa l’introduzione di Stable Video Diffusion lo scorso novembre – l’analista senior di Forrester Rowan Curran ha affermato che tali video hanno richiesto più “cucitura insieme” per la coerenza dei personaggi e delle scene.
La coerenza e la lunghezza dei video di Sora, tuttavia, rappresentano “nuove opportunità per i creativi di incorporare elementi di video generati dall’intelligenza artificiale in contenuti più tradizionali, e ora anche di generare video narrativi in piena regola da uno o pochi suggerimenti”, ha detto Curran a The Associated Press via e-mail venerdì.
Quali sono i rischi potenziali?
Sebbene le capacità di Sora abbiano sbalordito gli osservatori sin dal lancio di giovedì, rimane anche l’ansia per le implicazioni etiche e sociali dell’uso dei video generati dall’intelligenza artificiale.
Havemeyer, ad esempio, sottolinea i rischi sostanziali nel ciclo elettorale potenzialmente difficile del 2024.
Avere un modo “potenzialmente magico” per generare video che possano sembrare realistici presenta una serie di problemi all’interno della politica e non solo, ha aggiunto, indicando problemi di frode, propaganda e disinformazione.
“Le esternalità negative dell’intelligenza artificiale generativa saranno un argomento critico di dibattito nel 2024”, ha affermato Havemeyer. “È una questione sostanziale che ogni azienda e ogni persona dovrà confrontarsi quest’anno”.
Le aziende tecnologiche continuano a dettare legge quando si tratta di governare l’intelligenza artificiale e i suoi rischi, mentre i governi di tutto il mondo lavorano per mettersi al passo.
A dicembre, l’Unione Europea ha raggiunto un accordo sulle prime regole complete sull’IA al mondo, ma l’atto non entrerà in vigore prima di due anni dall’approvazione finale.
Giovedì, OpenAI ha dichiarato che stava adottando importanti misure di sicurezza prima di rendere Sora ampiamente disponibile.
“Stiamo lavorando con i red teamer – esperti di dominio in aree come disinformazione, contenuti che incitano all’odio e pregiudizi – che testeranno il modello in modo contraddittorio”, ha scritto la società.
“Stiamo anche costruendo strumenti per aiutare a rilevare contenuti fuorvianti, come un classificatore di rilevamento in grado di capire quando un video è stato generato da Sora”.
Il vicepresidente per gli affari globali di OpenAI, Anna Makanju, lo ha ribadito parlando venerdì alla Conferenza sulla sicurezza di Monaco, dove OpenAI e altre 19 società tecnologiche si sono impegnate a collaborare volontariamente per combattere i deepfake elettorali generati dall’intelligenza artificiale.
Ha notato che la società stava rilasciando Sora “in un modo abbastanza cauto”.
Allo stesso tempo, OpenAI ha rivelato informazioni limitate su come è stata costruita Sora.
Il rapporto tecnico di OpenAI non ha rivelato quali immagini e fonti video siano state utilizzate per addestrare Sora e la società non ha risposto immediatamente alla richiesta di ulteriori commenti venerdì.
Il rilascio di Sora arriva anche nel contesto di azioni legali contro OpenAI e il suo partner commerciale Microsoft da parte di alcuni autori e del New York Times per l’uso di opere di scrittura protette da copyright per addestrare ChatGPT.
Image:Getty Images