Le aziende di intelligenza artificiale hanno già vinto sulle questioni relative al diritto d’autore? Alcuni esperti dicono di sì, anche se la decisione potrebbe essere caso per caso.
Quando un anno fa il fotografo tedesco Robert Kneschke utilizzò un sito web online per verificare se le sue fotografie protette da copyright fossero state utilizzate per addestrare strumenti di intelligenza artificiale (AI), rimase “sbalordito e scioccato” da quante ne trovò.
Almeno 20 immagini con filigrana del suo portfolio sono state raccolte in set di dati forniti dall’organizzazione no-profit tedesca LAION per addestrare sistemi di apprendimento automatico come Stable Diffusion.
Ma quando il fotografo ha chiesto di rimuovere le foto, gli avvocati della LAION hanno sostenuto che il database forniva accesso alle immagini pubblicamente disponibili su Internet e non ne salvava copie.
Con la data del processo fissata per il 25 aprile ad Amburgo, il caso di Kneschke sarà uno dei primi processi di questo tipo in Europa poiché artisti, autori e aziende intenteranno azioni legali contro società di intelligenza artificiale che si sono formate su contenuti scartati da Internet.
Gli esperti dicono, tuttavia, che la questione di questi strumenti che utilizzano opere protette da copyright per la formazione non ha una conclusione scontata, ed è probabile che venga interpretata dai tribunali caso per caso come se si presentassero ulteriori novità.
La violazione del copyright sarà “difficile da dimostrare”
I modelli di intelligenza artificiale generativa come ChatGPT vengono addestrati su grandi quantità di materiale e informazioni per imparare come produrre contenuti simili a quelli umani.
“Addestrare un modello che genera contenuti è molto simile a me leggere una serie di romanzi di John Steinbeck e poi scrivere un romanzo per cercare di imitare lo stile di John Steinbeck”, ha affermato Marc Kaufman, partner di Rimon Law a Washington DC.
Se scrivesse un romanzo che raccontasse la stessa storia di uno dei romanzi di Steinbeck, allora potrebbe trattarsi di una violazione del copyright, mentre se imitasse lo stile di scrittura probabilmente non verrebbe considerato tale.
“Imitare uno stile non è realmente una violazione del copyright. Copiare una storia è una violazione del copyright”, ha affermato.
Google e OpenAI hanno fornito argomentazioni simili a favore della formazione sull’apprendimento automatico alla fine dello scorso anno in risposte separate al Copyright Office degli Stati Uniti, come parte della sua indagine su intelligenza artificiale e copyright.
Google ha confrontato gli strumenti di intelligenza artificiale per la formazione con un precedente caso giudiziario, affermando che “l’atto di leggere un libro e apprendere i fatti e le idee al suo interno” non costituirebbe una violazione.
OpenAI ha sottolineato che i sistemi non salvano copie e dovrebbero generare nuovi contenuti.
“Quando viene richiesta una risposta, il modello utilizza i suoi pesi per scrivere una nuova risposta ogni volta che viene richiesta”, ha affermato il consulente legale generale di OpenAI.
“Non copia la risposta dai dati pre-addestramento né vi accede tramite un database. Proprio come una persona che ha letto un libro e lo mette da parte, i nostri modelli non hanno accesso alle informazioni di formazione dopo aver imparato da esso”.
Kaufman afferma che la violazione del copyright dovrebbe essere basata “sul risultato del modello di intelligenza artificiale” e su quanto sia simile all’opera originale, opinione condivisa da altri esperti.
Ha sostenuto, tuttavia, che si potrebbe presumere che abbia acquistato i romanzi legittimamente, mentre alcuni creatori potrebbero sostenere che le società di intelligenza artificiale abbiano copiato illegittimamente la loro arte o testo direttamente da Internet.
Un problema è che le persone potrebbero non sapere se il loro materiale è stato utilizzato, rendendolo “difficile da dimostrare perché l’opera protetta non esiste più, è solo il risultato dell’apprendimento automatico”, ha affermato Daniel Westman, un legale indipendente. consulente sul diritto d’autore in Svezia.
Diversi importanti casi di diritto d’autore sono stati depositati negli Stati Uniti, con il New York Times che ha citato in giudizio OpenAI, produttore di ChatGPT, per “miliardi di dollari di danni legali ed effettivi” per aver utilizzato i suoi articoli per la formazione.
Gli avvocati del giornale sostengono che “l’uso illegale” dei suoi articoli consentirà agli strumenti di intelligenza artificiale di creare contenuti per competere con il New York Times, con la causa che include esempi specifici di “output che recita testualmente il contenuto del Times”.
Ma mentre casi come questo potrebbero dipendere da una clausola di “fair use” negli Stati Uniti che prevede alcune eccezioni per l’uso senza licenza delle opere, ci sono alcune differenze nell’Unione Europea che potrebbero favorire i titolari dei diritti.
La direttiva UE consente l'”opt-out”
Sebbene ci sia stato uno sforzo per incorporare una “clausola di fair use” simile a quella degli Stati Uniti nel diritto dell’UE, secondo l’esperta di proprietà intellettuale Marianne Levin dell’Università di Stoccolma, i paesi europei si sono tutti seduti al tavolo con specifiche eccezioni.
“Ora hai una sorta di buffet in questo paragrafo [of the EU copyright directive] con molte eccezioni diverse”, ha spiegato.
Invece di queste eccezioni, gli esperti hanno indicato una direttiva UE più recente come base per i casi di copyright relativi all’intelligenza artificiale.
Un portavoce della Commissione europea ha dichiarato a Euronews Next che, come regola generale, “lo sviluppatore o l’utente dell’intelligenza artificiale dovrebbe chiedere il consenso del titolare dei diritti” per utilizzare opere protette da copyright per l’addestramento dei sistemi di intelligenza artificiale.
La Commissione ha già fatto riferimento a una direttiva del 2019, in vigore negli stati dell’UE da giugno 2021, che prevede una clausola più specifica sul “text and data mining”, il processo automatizzato di analisi di grandi quantità di contenuti per trovare schemi.
La direttiva consente ai creatori come artisti e autori di rinunciare all’utilizzo delle loro opere per tale scopo.
“Al giorno d’oggi, in Europa si discute molto se questa eccezione sia applicabile per prendere il materiale di qualcun altro e usarlo per l’apprendimento automatico”, ha detto Westman, ma al momento non esiste “un modo standardizzato per rinunciarvi”. da ogni uso”, con alcuni esperti dubbiosi sulla sua applicazione.
Il commissario per il mercato interno Thierry Breton ha affermato che questa direttiva si applica al “contesto dell’intelligenza artificiale”. una risposta a al Parlamento europeo nel marzo 2023.
Se fosse necessario il consenso dei titolari dei diritti, in Europa potrebbero esserci licenze limitate per le opere destinate all’addestramento degli strumenti di intelligenza artificiale.
“C’è una rivendicazione naturale da parte della società artistica e musicale in cui dicono, ‘ma ora stanno usando le nostre opere, perché non veniamo pagati?'” Ha detto Levin.
Questa è stata una delle preoccupazioni evidenziate dagli autori e dagli attori. scioperi a Hollywood l’anno scorso che ha bloccato il settore per mesi. Tuttavia gli accordi successivi non si sono conclusi con il divieto assoluto di utilizzare il loro lavoro per l’addestramento dell’IA.
“Questo è un argomento che continueremo a monitorare e, a seconda dell’esito del contenzioso e degli studi, possiamo rivisitare l’argomento se i tribunali e l’ufficio del copyright ritengono che la formazione richieda il consenso”, ha detto la gilda degli attori SAG-AFTRA sul loro sito web.
Sono già iniziati accordi per la licenza dei contenuti con alcune organizzazioni che stipulano accordi con OpenAI, ad esempio, per utilizzare i loro materiali per la formazione. Axel Springer che possiede BILD e WELT annunciato tale partnership con il produttore ChatGPT nel dicembre 2023.
Il database tedesco di formazione LAION sottolinea che le persone potrebbero aiutare le aziende di intelligenza artificiale utilizzando una licenza di pubblico dominio per fornire anche l’accesso ai propri dati, il che, secondo loro, aiuterebbe a democratizzare e potenziare il settore.
Più trasparenza in arrivo?
La nuova legge europea sull’intelligenza artificiale include una disposizione sulla trasparenza, che obbliga le aziende a divulgare sintesi sui “contenuti utilizzati per la formazione” dei modelli di apprendimento automatico.
Diventerà applicabile due anni dopo la sua entrata in vigore approvazione formale al Parlamento europeo, fatta eccezione per alcuni divieti che entrano in vigore prima.
Westman ha affermato che questo tipo di obbligo potrebbe rendere le cose “un po’ migliori per i titolari dei diritti”, ma non cambia nulla a “livello fondamentale”.
Jenia Jitsev, cofondatrice del database LAION che quest’anno affronta il caso del fotografo tedesco in tribunale, ha dichiarato in una e-mail a Euronews Next che l’organizzazione AI sostiene la trasparenza per i modelli di apprendimento automatico, sottolineando che offrono l’unica formazione trasparente set di dati.
Un portavoce della Commissione europea ha aggiunto che, sebbene “l’interazione tra intelligenza artificiale e diritto d’autore sia complessa e richieda un monitoraggio costante”, le norme attuali sono “generalmente sufficienti per affrontare le diverse questioni sollevate”.
Si aspettano che i futuri problemi di copyright verranno risolti caso per caso.
Levin ha affermato che in molti modi i produttori di strumenti di intelligenza artificiale hanno vinto essendo i primi mentre altri tentano di recuperare terreno in termini normativi.
“Hanno una certa distanza da cui hanno già iniziato, quindi penso che abbiano vinto”, ha detto.
Image:Getty Images