Scrittori contro OpenAI: cosa ci insegna la class action sul training AI e il diritto d’autore

Nel settembre 2023, diciassette scrittori americani — tra cui George R.R. Martin, John Grisham e Jonathan Franzen — hanno depositato una class action contro OpenAI presso il Tribunale di New York. L’accusa: aver usato i loro libri senza autorizzazione per addestrare ChatGPT, violando il copyright su opere che rappresentano anni di lavoro e la principale fonte di reddito di ciascuno di loro.

La causa è diventata il simbolo di un conflitto più ampio che riguarda ogni autore, ogni editore e ogni titolare di diritti: quando un’intelligenza artificiale viene addestrata su opere protette, chi ha diritto a cosa?

I fatti: cosa ha fatto OpenAI e perché è contestato

Per addestrare un modello linguistico come ChatGPT, OpenAI ha raccolto enormi quantità di testo da internet — articoli, libri, documenti, canzoni — senza specificare pubblicamente quali fonti ha utilizzato né ottenere il consenso dei titolari dei diritti.

La class action degli scrittori sosteneva tre violazioni distinte. Prima: la riproduzione non autorizzata delle opere per creare il dataset di training. Seconda: la capacità di ChatGPT di riprodurre, su richiesta, estratti riconoscibili dai libri degli autori. Terza: la creazione di uno strumento che compete direttamente con il mercato delle opere originali — chiunque può chiedere a ChatGPT di scrivere “nello stile di George R.R. Martin” o “un thriller alla Grisham”, riducendo potenzialmente il valore commerciale delle opere originali.

OpenAI si è difesa invocando il fair use americano — la dottrina che permette usi limitati di opere protette senza consenso quando l’uso è trasformativo e non danneggia il mercato dell’originale. La difesa sosteneva che il training sia un uso trasformativo perché trasforma i testi in parametri statistici, non li riproduce nella forma originale.

Gli sviluppi: dove è arrivata la causa

La class action degli scrittori non è rimasta isolata. Nel 2024 si è ampliata, altri autori si sono aggiunti, e cause analoghe sono state depositate da editori, musicisti e artisti visivi contro varie aziende AI.

Sul fronte Anthropic — che ha seguito un percorso parallelo — il giudice Alsup ha riconosciuto il fair use per il training in sé, ma ha distinto nettamente l’uso di copie piratate, che resta un illecito separato. Anthropic ha poi scelto di pagare 1,5 miliardi di dollari nel più grande settlement di copyright della storia americana — circa 3.000 dollari per opera, per 500.000 opere protette.

Il messaggio del mercato è stato più chiaro della giurisprudenza: anche quando il training è legalmente difendibile, il costo reputazionale e strategico di non licenziare le opere è diventato insostenibile per le grandi aziende AI. OpenAI ha iniziato a siglare accordi di licenza con editori e organizzazioni di categoria. Il dibattito si è spostato da “è lecito o no” a “quanto vale una licenza di training”.

Per gli autori indipendenti e gli editori piccoli, però, questo mercato delle licenze non esiste ancora in forma accessibile. Sono stati usati, e gli accordi milionari riguardano i grandi player.

Il diritto italiano: cosa cambia per un autore che pubblica online

Il fair use americano non esiste in Italia. Le eccezioni al diritto d’autore nel nostro ordinamento sono tassative — elencate dalla legge, non valutate caso per caso con un test di ragionevolezza.

La norma rilevante per il training AI è il text and data mining (TDM), disciplinato dagli artt. 70-quater e 70-quinquies della Legge 633/1941, introdotti con il recepimento della Direttiva DSM 2019/790.

Cosa permettono le eccezioni TDM italiane:

L’art. 70-quater permette la riproduzione e l’estrazione di opere per finalità di ricerca scientifica, a condizione che l’opera sia accessibile lecitamente e che l’uso non sia commerciale. È l’eccezione per università, centri di ricerca, progetti scientifici non profit.

L’art. 70-quinquies — l’eccezione più rilevante per il training AI commerciale — permette il TDM anche per scopi commerciali, ma con una condizione fondamentale: il titolare dei diritti può fare opt-out. Se un autore o un editore riserva esplicitamente le proprie opere escludendo il TDM commerciale, quella riserva deve essere rispettata.

Il problema dell’opt-out passivo. Il sistema italiano — e quello europeo in generale — carica il titolare dell’onere di agire. Non è OpenAI o qualsiasi altra azienda AI a dover chiedere il permesso: è l’autore a dover dichiarare esplicitamente che non vuole che le sue opere vengano usate. Se non lo fa, il silenzio vale come acquiescenza.

Questo significa che se hai pubblicato libri, articoli, testi online prima del 2023 senza mai inserire una riserva TDM, le tue opere erano tecnicamente disponibili per il training commerciale nel quadro dell’art. 70-quinquies.

Come esercitare l’opt-out in Italia

L’opt-out dal TDM commerciale deve essere esplicito e tecnicamente accessibile. Non basta un disclaimer generico sul sito.

Per i siti web. Il modo più diffuso è il file con istruzioni specifiche per i crawler AI, oppure il meta-tag nelle pagine. Alcune piattaforme (come Substack o Ghost) hanno già introdotto opzioni di opt-out native nelle impostazioni.

Per i contratti editoriali. La riserva TDM può essere inserita come clausola nei contratti di cessione dei diritti all’editore. Se stai negoziando un contratto adesso, questa clausola va richiesta esplicitamente. Se hai contratti firmati prima del 2023, vale la pena verificare se la cessione dei diritti include implicitamente l’uso per training AI — e, in caso affermativo, discutere un addendum.

Per le opere già pubblicate online. Puoi dichiarare retroattivamente la riserva, ma l’efficacia per il passato è limitata: copre i futuri usi, non quelli già avvenuti.

Il danno al mercato: la questione aperta

La class action degli scrittori americani sollevava un argomento che va oltre la violazione tecnica del copyright: ChatGPT crea uno strumento che compete con il mercato delle opere originali. Chiunque può chiedere a un modello linguistico di produrre testo nello stile di un autore specifico, a costo zero o quasi. Questo non è solo un problema di royalty non pagate sul training — è una minaccia al modello economico della scrittura professionale.

Il diritto d’autore italiano e europeo non tutela lo stile come tale — la giurisprudenza è consolidata su questo punto. Non puoi impedire a qualcuno di “scrivere come Calvino” se non copia frasi specifiche. Ma la questione del danno al mercato è diversa: se uno strumento addestrato sulle tue opere senza compenso ti sottrae una quota del tuo mercato, il danno è reale anche se la violazione è tecnicamente contestabile.

Questo è il terreno su cui si giocherà il prossimo decennio di contenzioso AI. Non solo “era lecito addestrare il modello?” ma “chi paga per la perdita di valore economico che ne deriva?”

Cosa fare se sei un autore o un editore

Verifica i tuoi contratti esistenti. Se hai ceduto i diritti editoriali su opere pubblicate, leggi le clausole sulla cessione: includono esplicitamente o implicitamente l’uso per training AI? In assenza di previsione esplicita, la questione è interpretativa — e vale la pena ottenerla per iscritto.

Inserisci la riserva TDM nei nuovi contratti. Ogni contratto di cessione firmato da oggi dovrebbe includere una clausola che esclude esplicitamente l’uso delle opere per il training di modelli AI, salvo accordo separato e compenso specifico.

Dichiara l’opt-out sulle opere online. Se pubblichi sul tuo sito, su newsletter, su piattaforme editoriali, configura le opzioni di opt-out disponibili e aggiungi una riserva esplicita nelle note legali.

Monitora l’evoluzione normativa. La Commissione europea sta lavorando a linee guida più specifiche sull’applicazione del TDM. La situazione cambierà — probabilmente verso un sistema di licenze obbligatorie con compenso, simile a quello che si è sviluppato per la musica con SIAE e SCF.

Hai pubblicato opere che potrebbero essere state usate per il training AI, o stai negoziando contratti editoriali e vuoi inserire clausole di protezione adeguate? Prenota una consulenza o scrivici direttamente.

Articoli correlati:

Lo Studio Legale Dandi fornisce assistenza legale in Diritto d'autore. Dai un'occhiata ai nostri servizi oppure contattaci!

Scrittori contro OpenAI: cosa ci insegna la class action sul training AI e il diritto d’autore

Scrittori contro OpenAI: cosa ci insegna la class action sul training AI e il diritto d’autore

I fatti: cosa ha fatto OpenAI e perché è contestato

Gli sviluppi: dove è arrivata la causa

Il diritto italiano: cosa cambia per un autore che pubblica online

Come esercitare l’opt-out in Italia

Il danno al mercato: la questione aperta

Cosa fare se sei un autore o un editore

Claudia Roggero

Tipi di marchio: cosa può essere registrato e cosa no

Titolo di un’opera: di film, libro o canzone: come si tutelano?

Related Posts:

Secondary meaning, marchio debole, marchio forte, marchio descrittivo

Immagini di personaggi famosi: quando puoi usarle e quando no

Falsi d’autore: conseguenze legali, certificati e diritto di seguito

Scrittori contro OpenAI: cosa ci insegna la class action sul training AI e il diritto d’autore

Scrittori contro OpenAI: cosa ci insegna la class action sul training AI e il diritto d’autore

I fatti: cosa ha fatto OpenAI e perché è contestato

Gli sviluppi: dove è arrivata la causa

Il diritto italiano: cosa cambia per un autore che pubblica online

Come esercitare l’opt-out in Italia

Il danno al mercato: la questione aperta

Cosa fare se sei un autore o un editore

Claudia Roggero

Post Navigation

Tipi di marchio: cosa può essere registrato e cosa no

Titolo di un’opera: di film, libro o canzone: come si tutelano?

Related Posts:

Secondary meaning, marchio debole, marchio forte, marchio descrittivo

Immagini di personaggi famosi: quando puoi usarle e quando no

Falsi d’autore: conseguenze legali, certificati e diritto di seguito