Clonazione vocale AI e deepfake: come Scarlett Johansson, Taylor Swift e Giusy Ferreri si tutelano — e cosa puoi fare tu

Clonazione vocale AI e deepfake: come Scarlett Johansson, Taylor Swift e Giusy Ferreri si tutelano — e cosa puoi fare tu Scarlett Johansson contro OpenAI

Clonazione vocale AI e deepfake: come Scarlett Johansson, Taylor Swift e Giusy Ferreri si tutelano — e cosa puoi fare tu

In pochi secondi di audio, un sistema di intelligenza artificiale è oggi in grado di replicare la voce di chiunque — timbro, inflessioni, ritmo, il respiro tra una parola e l’altra — con una fedeltà che può ingannare anche chi quella voce la conosce bene. Senza il consenso della persona. Spesso senza che quella persona lo sappia.

Scarlett Johansson lo ha scoperto ascoltando “Sky”, una delle voci di GPT-4o. Taylor Swift lo ha scoperto quando le sue immagini deepfake a sfondo sessuale hanno raggiunto decine di milioni di visualizzazioni in poche ore. Giusy Ferreri ha deciso di non aspettare di scoprirlo — e il 12 maggio 2026 è diventata la prima artista in Europa a registrare la propria voce come marchio sonoro all’EUIPO.

Questa guida ricostruisce i casi più rilevanti, spiega quali diritti sono in gioco nella clonazione vocale da parte dell’intelligenza artificiale, e quali strumenti — legali e contrattuali — esistono per proteggersi.

Il caso Scarlett Johansson e OpenAI: quando la voce è “simile” ma non identica

Nel maggio 2024 OpenAI presenta GPT-4o — la versione di ChatGPT in grado di conversare in modo naturale con gli utenti — con cinque voci virtuali tra cui una chiamata “Sky”. Scarlett Johansson ascolta la demo e rimane, come dirà lei stessa, “scioccata, arrabbiata e incredula“. Sky suona come lei. Come la sua voce nel film Her (2013), in cui aveva doppiato un’intelligenza artificiale di nome Samantha.

Sam Altman, CEO di OpenAI, aveva contattato Johansson mesi prima per proporle di prestare la voce al sistema. L’attrice aveva rifiutato. Eppure Sky era lì, con quel timbro graffiato e caldo che il pubblico aveva imparato a riconoscere.

OpenAI ha risposto che Sky apparteneva a un’altra attrice — ingaggiata mesi prima che Altman contattasse Johansson — e che la somiglianza era coincidentale. I documenti interni, le dichiarazioni dei direttori di casting e dell’agente dell’attrice confermano questa versione. La registrazione dell’attrice che ha prestato la voce a Sky, ascoltata dal Washington Post, suonava effettivamente molto simile a quella di Johansson.

Nonostante la difesa, di fronte alla contestazione pubblica dell’attrice OpenAI ha sospeso la voce Sky. Il caso ha fatto emergere un problema normativo che nessuna legge aveva ancora affrontato in modo diretto: si può registrare una voce “simile” a quella di qualcuno senza il suo consenso? E, ancora più radicalmente: uno stile vocale — un timbro, una cadenza — è proteggibile dalla legge?

La risposta attuale è: dipende dal sistema giuridico e dal livello di somiglianza. Nel caso Johansson/OpenAI, la questione è rimasta nell’ambito della disputa pubblica senza arrivare a una sentenza. Ma il caso ha aperto un dibattito che artisti, avvocati e legislatori non hanno ancora chiuso.

Taylor Swift: dai deepfake sessuali al marchio sulla voce

Nel gennaio 2024, immagini sessualmente esplicite generate con l’intelligenza artificiale raffiguranti Taylor Swift hanno invaso X (ex Twitter) e altri social media. Un solo post ha raggiunto oltre 47 milioni di visualizzazioni prima della rimozione. La piattaforma ha rimosso i contenuti dopo ore di diffusione incontrollata; il Congresso americano ha iniziato a discutere legislazione specifica sui deepfake non consensuali.

L’episodio è rimasto senza conseguenze legali dirette — non esisteva ancora una legge federale americana che criminalizzasse esplicitamente i deepfake pornografici non consensuali. Ma ha reso Taylor Swift uno dei simboli globali della battaglia contro l’uso non autorizzato dell’identità digitale.

La risposta strategica è arrivata nell’aprile 2026: i legali di Swift hanno depositato tre domande di registrazione del marchio presso l’USPTO, chiedendo protezione per due frasi pronunciate dalla cantante — “Hey, it’s Taylor Swift” e “Hey, it’s Taylor” — e per una sua fotografia sul palco con chitarra rosa, body iridescente e stivali argentati.

La logica è chiara: registrando frasi e immagini come marchi commerciali, l’artista ottiene una base giuridica più solida per citare in giudizio chiunque utilizzi l’IA per creare imitazioni della sua persona o della sua voce. Il marchio sonoro è uno strumento più rapido del copyright in sede giudiziaria — e con la clonazione vocale AI che avviene in tempo reale, la velocità conta.

Giusy Ferreri: la prima artista europea con il marchio sonoro vocale

Il 12 maggio 2026, Giusy Ferreri è diventata la prima artista in Europa a depositare ufficialmente il marchio sonoro della propria voce presso l’EUIPO (Ufficio dell’Unione Europea per la Proprietà Intellettuale). Il deposito consiste in un file audio in cui la cantante pronuncia il suo nome: “Sono Giusy Ferreri”. Poche parole che serviranno per identificare e tutelare la sua voce e la sua identità da repliche realizzate con l’intelligenza artificiale.

Perché il marchio sonoro è uno strumento più efficace del solo diritto d’autore

Il diritto d’autore protegge le opere creative — le canzoni, le registrazioni — ma non la voce in quanto tale. Il marchio sonoro vocale, invece, trasforma quel timbro in un bene giuridicamente protetto come un brand commerciale: proprio come un marchio commerciale non può essere sfruttato senza licenza, così la voce registrata non può essere clonata e venduta da terzi.

I vantaggi pratici:

  • la procedura di takedown per violazione di marchio è più rapida di una causa per copyright
  • il marchio è opponibile a chiunque — incluse le aziende che sviluppano sistemi AI
  • tutela valida in tutti i 27 paesi UE con un unico deposito
  • rinnovabile ogni 10 anni — non scade come il copyright

La decisione di Ferreri giunge in una fase storica in cui i software di AI sono in grado di clonare tonalità e inflessioni in pochi minuti, creando contenuti sintetici mai realmente registrati dall’artista.

Morgan Freeman, Luca Ward e il caso della voce come strumento di lavoro

Il tema non riguarda solo le pop star. Morgan Freeman — una delle voci più iconiche del cinema mondiale, noto per il suo lavoro di doppiatore e narratore — ha espresso pubblicamente il proprio allarme per i tentativi di replicare la sua voce tramite intelligenza artificiale, usando gli hashtag “truffa” e “IdentityProtection”.

In Italia, Luca Ward — doppiatore di Russell Crowe, Keanu Reeves e decine di altri protagonisti del grande schermo — è stato il primo artista italiano a depositare il proprio timbro vocale per tutelarsi dalla clonazione AI, rafforzando le tutele già previste dall’art. 10 del Codice Civile con un livello di protezione più attivo e più facilmente azionabile di fronte a usi commerciali non autorizzati. → Approfondimento: Luca Ward registra la sua voce: la mossa che ogni artista italiano dovrebbe fare

Il caso Ward è emblematico perché il doppiaggio è un mestiere in cui la voce è letteralmente il prodotto. La sua clonazione non autorizzata non è solo una violazione di identità — è concorrenza diretta al lavoro del professionista. Con strumenti come ElevenLabs e i più recenti modelli di sintesi vocale, bastano pochi minuti di audio per replicare un timbro in modo pressoché indistinguibile dall’originale: il doppiatore rischia di vedersi sottratto lavoro senza che venga chiesto nessun permesso né corrisposto nessun compenso. La mossa di Ward, seguita ora da Giusy Ferreri a livello europeo, sta diventando il nuovo standard di tutela per chiunque utilizzi la voce come strumento principale di lavoro.

Come funziona la clonazione vocale AI: perché il problema è strutturale

Capire il meccanismo tecnico aiuta a capire perché il problema è difficile da contenere con gli strumenti legali tradizionali.

I sistemi di sintesi vocale generativa si basano su reti neurali addestrate su grandi quantità di audio. Una volta addestrato, il modello non copia e incolla segmenti dell’audio originale — apprende il tuo modo di esprimerti: le inflessioni, i respiri, il timbro. Dopo il processo di clonazione, il software può far dire o cantare alla tua voce letteralmente di tutto.

Le implicazioni sono tre:

  • Basta pochissimo audio per clonare una voce: alcuni sistemi richiedono meno di 10 secondi di campione. Qualsiasi persona che abbia mai pubblicato un video sui social media è potenzialmente vulnerabile.
  • L’output non è una copia — è una sintesi: questo crea problemi di prova nelle azioni legali. Non si può dimostrare che il sistema AI abbia “copiato” una registrazione specifica; si può dimostrare che l’output è una replica riconoscibile della voce originale.
  • La velocità supera i meccanismi di enforcement: un contenuto deepfake può raggiungere milioni di persone prima che qualsiasi procedura legale possa bloccarlo.

Quali diritti protegge la legge italiana

La voce di una persona è protetta da più strumenti giuridici — parzialmente sovrapposti e con diversi meccanismi di enforcement.

Il diritto all’immagine e alla voce

L’art. 10 del Codice Civile e gli artt. 96-97 della Legge sul Diritto d’Autore proteggono il ritratto e la voce di una persona: nessuno può usarli senza il suo consenso. La voce, come l’immagine, è un elemento identificativo della persona e la sua riproduzione non autorizzata — inclusa la replica sintetica — configura una violazione dei diritti della personalità. → Approfondimento: Liberatoria utilizzo immagini e voce: quando serve e cosa deve contenere

Il GDPR e i dati biometrici

Il GDPR (Reg. UE 2016/679) classifica i dati biometrici — inclusa la voce — come categoria speciale di dati personali, il cui trattamento richiede il consenso esplicito dell’interessato o un’altra base giuridica specifica. Raccogliere campioni audio di una persona per addestrare un sistema AI senza il suo consenso è una violazione del GDPR sanzionabile dal Garante per la Protezione dei Dati Personali, con sanzioni fino al 4% del fatturato mondiale annuo.

Il diritto d’autore sulle registrazioni

Le specifiche registrazioni audio di una persona — le sessioni di doppiaggio, le canzoni incise in studio — sono protette dai diritti connessi dell’artista interprete ed esecutore ai sensi degli artt. 80 e ss. della LDA. Nessuno può usarle per addestrare sistemi AI senza autorizzazione. → Approfondimento: Diritti d’autore musica: diritti connessi degli artisti

Il marchio sonoro vocale: come funziona e quando conviene

Il marchio sonoro è uno dei pochi strumenti di proprietà intellettuale che tutela la voce in quanto tale — non la singola registrazione, ma il timbro come segno distintivo identificativo di una persona o di un brand.

Come si registra

La registrazione richiede il deposito di un file audio che contenga il suono da proteggere, presso:

  • EUIPO — per la tutela in tutti i 27 paesi UE
  • UIBM — per la sola tutela italiana
  • USPTO — per la tutela negli USA

Il marchio sonoro deve avere carattere distintivo — deve essere riconoscibile come segno identificativo di quella persona o entità, non come un suono generico. Per una voce artistica già nota, questa condizione è solitamente soddisfatta.

Quando conviene rispetto agli altri strumenti

Il marchio sonoro è particolarmente utile quando:

  • la voce è un asset commerciale rilevante (artisti, doppiatori, speaker, presentatori)
  • si vuole uno strumento di enforcement più rapido del copyright nelle procedure di takedown sulle piattaforme
  • si vuole costruire una base giuridica solida per azioni contro i sistemi AI che clonano la voce

→ Approfondimento: Proprietà intellettuale: gli strumenti di tutela disponibili

Le clausole AI nei contratti: la tutela preventiva obbligatoria

Per artisti, doppiatori, attori e chiunque presti la propria voce in un contesto professionale, la tutela più immediata e meno costosa è contrattuale: inserire clausole specifiche che vietino l’uso della voce per sistemi AI prima ancora che il problema si presenti.

Una clausola AI vocale efficace deve specificare:

  • il divieto esplicito di usare le registrazioni della voce per addestrare sistemi di intelligenza artificiale generativa
  • il divieto di creare sintesi vocali che replichino il timbro, lo stile o le caratteristiche identificative della voce del prestatore
  • il divieto di usare la voce sintetica in contenuti deepfake o in qualsiasi contesto che possa creare confusione sull’identità della persona
  • le conseguenze della violazione — risoluzione del contratto, risarcimento del danno, obbligo di rimozione dei contenuti

Nel settore audiovisivo italiano, queste clausole sono diventate obbligatorie per legge: il D.I. MiC-MEF n. 225/2024 impone che i contratti con autori, interpreti ed esecutori contengano — a pena di inammissibilità al tax credit — il diritto di ciascun soggetto di non acconsentire allo sfruttamento della propria prestazione da parte di sistemi AI generativi.

→ Approfondimento: Clausole AI nei contratti: guida completa
→ Approfondimento: Intelligenza artificiale e diritto d’autore: AI Act e tutela delle opere

L’AI Act e gli obblighi delle piattaforme

L’AI Act (Reg. UE 2024/1689), in vigore dall’agosto 2024 e pienamente applicabile da agosto 2025 per i sistemi di AI general purpose, impone agli sviluppatori di modelli AI obblighi rilevanti in materia di protezione delle identità vocali.

I punti più rilevanti per la clonazione vocale:

  • Trasparenza sul training: i fornitori di modelli AI devono pubblicare un sommario dei dati usati per l’addestramento. Se quei dati includono registrazioni vocali di persone fisiche, deve essere documentato e i titolari possono esercitare il diritto di opt-out.
  • Identificazione dei contenuti deepfake: i sistemi AI che generano contenuti sintetici — incluse sintesi vocali — devono assicurarsi che i contenuti siano identificabili come generati da AI. La voce sintetica che si spaccia per quella originale di una persona viola questo obbligo.
  • Sanzioni: le violazioni degli obblighi dell’AI Act possono comportare sanzioni fino al 3% del fatturato mondiale annuo per i fornitori dei sistemi.

Cosa fare se la tua voce viene clonata senza consenso

Il percorso dipende dall’entità del danno e dalla tua posizione — se sei un artista professionista o una persona privata.

Documentare la violazione

Prima di qualsiasi azione: screenshot, registrazioni, link ai contenuti, data di prima pubblicazione. I contenuti deepfake vengono rimossi rapidamente una volta segnalati — la prova deve essere conservata prima della rimozione.

Segnalazione alla piattaforma

Le principali piattaforme (YouTube, Instagram, TikTok, X) hanno procedure specifiche per la segnalazione di contenuti deepfake non consensuali. Dopo il caso Taylor Swift, X ha rafforzato le policy sui contenuti AI generati non consensuali. La segnalazione porta alla rimozione in tempi relativamente rapidi — ma non risolve il problema alla fonte.

Opt-out dalle piattaforme AI

OpenAI, Google, Stability AI e altri fornitori offrono moduli per richiedere la rimozione dei propri contenuti dai dataset di training. Va fatto esplicitamente — il silenzio equivale al consenso. File robots.txt che escludono i crawler AI dal proprio sito web è una misura aggiuntiva.

Diffida al responsabile

Se il responsabile è identificabile — un utente, un’azienda, un servizio — la diffida formale è il primo strumento legale. Deve indicare la violazione, la base normativa, la richiesta di rimozione e l’eventuale risarcimento.

Segnalazione al Garante Privacy

Se la clonazione vocale ha comportato il trattamento di dati biometrici senza consenso — come accade quasi sempre — la segnalazione al Garante per la Protezione dei Dati Personali può attivare un’indagine con possibili sanzioni significative nei confronti del responsabile.

Azione civile

Per i casi con danno economico rilevante — un doppiatore che perde lavoro perché qualcuno usa una sua copia AI, un artista il cui stile viene monetizzato da terzi — l’azione civile per risarcimento del danno patrimoniale e non patrimoniale è lo strumento definitivo. → Approfondimento: Violazione copyright e diritti: conseguenze e tutela

Domande frequenti

È legale usare la voce di una persona per addestrare un sistema AI senza consenso?

No. Viola il diritto alla voce (art. 10 c.c., artt. 96-97 LDA) e il GDPR (dati biometrici come categoria speciale). L’AI Act impone obblighi di trasparenza e rispetto degli opt-out ai fornitori di modelli AI.

Cos’è un marchio sonoro vocale e come funziona?

Un tipo di marchio che tutela una voce come segno distintivo. Registrato all’EUIPO (UE) o USPTO (USA), conferisce il diritto esclusivo su quella specifica impronta vocale e permette di agire più rapidamente rispetto al copyright contro clonazioni AI non autorizzate.

Cosa ha fatto Giusy Ferreri per proteggere la sua voce dall’AI?

Il 12 maggio 2026 ha depositato il marchio sonoro della propria voce all’EUIPO — prima artista in Europa a farlo — con un file audio di pochi secondi in cui pronuncia il proprio nome. Trasforma il suo timbro graffiato in un bene giuridicamente protetto in tutta l’UE.

Cosa ha fatto Taylor Swift per proteggersi dai deepfake?

Nell’aprile 2026 ha depositato all’USPTO tre domande di marchio per tutelare voce (“Hey, it’s Taylor Swift”) e immagine. Una risposta strategica ai deepfake sessuali del 2024 che l’avevano colpita e che avevano raggiunto decine di milioni di visualizzazioni.

Cosa è successo tra Scarlett Johansson e OpenAI?

Nel 2024 OpenAI ha presentato GPT-4o con una voce (“Sky”) molto simile a quella di Johansson, che aveva rifiutato di prestare la sua. OpenAI ha sostenuto che appartenesse a un’altra attrice. Di fronte alla contestazione pubblica, ha sospeso la voce Sky. Il caso ha sollevato la questione irrisolta: lo stile vocale è proteggibile?

Come posso tutelare la mia voce dall’uso AI senza consenso?

Clausole contrattuali esplicite in ogni accordo in cui presti la voce; registrazione del marchio sonoro per chi ha una voce commercialmente distintiva; opt-out dalle piattaforme AI; file robots.txt per i siti propri. In caso di violazione già avvenuta: documentazione, segnalazione alla piattaforma, segnalazione al Garante Privacy, diffida al responsabile.

RisorsaDescrizione
Intelligenza artificiale e diritto d’autoreAI Act, etica, clausole nei contratti e protezione delle opere
Clausole AI nei contrattiCome proteggersi dall’uso AI di voce, immagine e opere
Liberatoria utilizzo immagini e voceQuando serve il consenso e cosa deve contenere il documento
Violazione copyrightConseguenze e come difendersi da usi non autorizzati
Proprietà intellettualePanoramica degli strumenti di tutela: marchi, copyright, brevetti
Diritti d’autore musicaDiritti connessi degli artisti e protezione delle registrazioni
EUIPO – Marchi sonoriCome registrare un marchio sonoro in tutta l’Unione Europea
Garante PrivacySegnalazioni per trattamento non autorizzato di dati biometrici
AI Act – Reg. UE 2024/1689Testo ufficiale su EUR-Lex
Artt. 80 e ss. LDA – Diritti connessi degli artistiTesto ufficiale su Normattiva

La tua voce è stata clonata senza consenso? Stai firmando un contratto che prevede registrazioni vocali e vuoi assicurarti che includa le clausole AI necessarie? Sei un artista che vuole valutare se registrare il marchio sonoro della propria voce? Contattaci: assistiamo artisti, doppiatori e professionisti nella tutela della propria identità vocale nell’era dell’intelligenza artificiale.

Leggi anche: Intelligenza artificiale e diritto d’autore · Clausole AI nei contratti · Liberatoria utilizzo immagini · Violazione copyright

Lo Studio Legale Dandi fornisce assistenza legale in Diritto d'autore. Dai un'occhiata ai nostri servizi oppure contattaci!

Avvocata specializzata in diritto d'autore, proprietà intellettuale e diritto dello spettacolo. A Roma dal 2003, lavoro con registi, produttori, musicisti e indipendenti — dalla fase di sviluppo fino alla distribuzione.

Site Footer