Chi di voi non ha ancora sentito parlare di intelligenza artificiale, la cosiddetta IA? Questa nuova tecnologia è entrata in maniera dirompente nel mondo della musica: dalle app che consentono la creazione di vere e proprie opere musicali, ai problemi circa le licenze dei contenuti che servono per addestrare le piattaforme di IA, ai diritti spettanti ai deployer (utenti delle piattaforme di IA), per non parlare delle innumerevoli cause presso le corti americane (e non solo) intentate dagli aventi diritto del settore discografico ed editoriale verso Suno AI & co.
Con questo articolo vogliamo inaugurare il nuovo anno offrendo un breve contributo sulle problematiche giuridiche legate all’uso dell’IA nel settore musicale, concentrandoci su tre aspetti principali: i diritti di utilizzo dei contenuti utilizzati per addestrare i sistemi di IA, la (eventuale) sussistenza del requisito dell’originalità (intesa quale carattere creativo) per le opere create attraverso i sistemi di IA e i principali procedimenti giudiziari riguardanti la violazione del diritto d’autore.
Precisiamo infine, per chiarezza massima, che trattiamo in questo articolo della forma di IA detta “generativa”, ovvero quella che, sfruttando reti neurali e algoritmi complessi, è in grado di creare “nuovi” contenuti (come testi, immagini, musica, ecc.). A differenza di altre forme di IA, che si limitano a eseguire compiti predefiniti, l’IA generativa produce nuovi contenuti, applicando funzioni statistiche (cioè che analizzano e predicono probabilità e relazioni tra i dati) coerenti con le richieste dell’utente.
L’addestramento dei sistemi di IA generativa: problemi e prospettive in Europa
Uno degli aspetti più controversi nell’impiego dell’intelligenza artificiale generativa nel settore musicale è il suo addestramento (cosiddetto “training”).
Rappresenta il processo mediante il quale un modello di IA apprende a svolgere compiti specifici, analizzando – statisticamente – grandi quantità di dati. Questo processo consente al modello di identificare schemi e relazioni all’interno dei dati, migliorando progressivamente le sue prestazioni. Difatti senza un adeguato addestramento l’IA non sarebbe in grado di interpretare correttamente gli input ricevuti né di fornire output pertinenti. In sintesi, l’addestramento permette all’IA di apprendere dai dati forniti, affinando le sue capacità di risposta e decisione in base agli input ricevuti.
In seguito, nei sistemi di AI con chat utente sono poi gli utenti a interrogare il sistema tramite “prompt”, ovvero istruzioni o domande formulate in linguaggio naturale che guidano l’IA nella generazione di risposte pertinenti (output). L’efficacia e pertinenza delle risposte dell’AI dipende in larga misura dalla chiarezza e specificità dei prompt forniti. I prompt stessi (con i dati e contenuti eventualmente presenti) possono essere utilizzati per l’addestramento o affinamento dei sistemi di AI, a seconda dei casi, del contesto, dello strumento, ecc.
I sistemi di IA come quelli utilizzati per creare musica (v. ad es. Suno o Udio) sono generalmente alimentati da grandi quantità di dati in fase di training, dati che – spesso e volentieri – includono opere protette da diritto d’autore e connessi. Se questi sistemi, quindi, vengono addestrati con contenuti per i quali non si possiedono le necessarie licenze o autorizzazioni, è di facile intuizione come possono nascere problematiche legali significative.
L’addestramento di sistemi di IA con contenuti protetti da privative senza una licenza adeguata potrebbe costituire una violazione dei diritti d’autore, sia sul piano morale che patrimoniale. In Italia e in Europa, ma grossomodo anche fuori dall’Europa, l’uso di opere protette deve avvenire previo consenso dell’autore o dei titolari dei diritti – salvo che non si tratti di un utilizzo rientrante nelle eccezioni previste dalla legge (ad esempio, nel nostro ordinamento, per scopi di critica, ricerca scientifica o didattica, parodia, o nel caso di copia privata ad uso personale).
L’inquadramento giuridico dell’addestramento delle intelligenze artificiali con opere protette da copyright rimane attualmente poco chiaro. In particolare vi sono incertezze sull’attività stessa: per esempio se costituisca, tutto o in parte, “riproduzione” e/o “analisi” statistica dei contenuti (che subiscono soprattutto codificazioni in forma di numeri, detti vettoriali). Poi ci si chiede se vi sia una possibile violazione della normativa sulle banche dati (che vieta l’estrazione significativa di dati).
Ma soprattutto se il training possa rientrare nelle eccezioni introdotte di recente: la normativa europea del 2019 (Direttiva UE 2019/790, poi recepita nella normativa italiana) per es. ha creato una doppia eccezione del “text and data mining” (TDM). Eccezione che consente l’estrazione di testo e dati (anche di tipo audiovisivo e fonografico) sia per scopi di ricerca scientifica (da parte di organismi di ricerca ecc.) sia in generale, per scopi anche commerciali (purché i titolari dei diritti non si siano espressamente riservati tali diritti, con apposita menzione detta “opt-out”, e l’accesso al contenuto sia lecito). Comunque l’applicazione pratica di queste eccezioni all’addestramento delle IA generative è ancora oggetto di dibattito.
Facciamo degli esempi. Immaginiamo che un’università voglia studiare l’evoluzione dei generi musicali nel tempo: per fare ciò, può utilizzare brani musicali (anche quelli protetti da diritto d’autore e connesso) per estrarre dati come le tendenze ritmiche, melodiche o armoniche, utilizzando tecniche automatizzate di TDM. L’università avrebbe accesso legale ai brani attraverso piattaforme che consentono l’uso di questi materiali a fini di ricerca scientifica. Questi brani possono essere memorizzati e utilizzati solo per lo scopo di ricerca e per verificare i risultati della ricerca, ma non possono essere utilizzati per fini commerciali o pubblicati senza rispettare le condizioni legali. L’accesso e l’uso dei brani devono essere sicuri e protetti, limitati alle attività di ricerca.
Cosa diversa è l’uso commerciale: un’azienda che sviluppa un software per il riconoscimento musicale potrebbe utilizzare brani audio protetti da copyright per allenare il sistema. Però sarebbe consentito solo se i titolari dei diritti non hanno riservato esplicitamente l’uso commerciale di tali brani, attraverso un’azione di “opt-out”. Se l’azienda ha accesso lecito ai brani allora può estrarre informazioni per migliorare il software, inoltre le copie dei brani devono essere conservate solo per il tempo necessario e non possono essere utilizzate oltre il contesto di ricerca e sviluppo del software.
V’è di più: la normativa europea sull’IA (il tanto citato “AI Act”, regolamento sull’intelligenza artificiale dell’Unione Europea) sottolinea l’importanza della trasparenza nei dati utilizzati per l’addestramento dei modelli di IA – soprattutto quando includono materiale protetto da copyright, richiedendo ai fornitori di modelli di IA di rispettare le riserve di diritti espresse dai titolari. Nonostante questi sviluppi normativi, permangono dubbi significativi sull’effettiva possibilità di utilizzo di opere protette per l’addestramento delle IA, evidenziando la necessità di ulteriori chiarimenti legislativi e giurisprudenziali.
Fair use e copyright: il contesto normativo americano/anglosassone
Su questo punto le opinioni sono contrastanti: i difensori “a spada tratta” dei sistemi di IA ritengono che l’attività di addestramento sia il frutto di un text e data mining basato sul fair use, eccezione al diritto d’autore di stampo americano che, in poche parole, prevede che l’uso equo di un’opera protetta da copyright per scopi come critica, commento, cronaca, insegnamento, studio o ricerca non costituisce una violazione del copyright.
Tuttavia, la giurisprudenza statunitense stabilisce che per determinare se sia ammissibile come fair use bisogna considerare congiuntamente vari fattori, cioè: 1) lo scopo dell’utilizzo dell’opera (commerciale o non commerciale ad es. perché a scopo didattico?); la natura dell’opera protetta utilizzata (un romanzo è diverso da un’opera musicale che è altresì diversa da un articolo di giornale); 3) la quantità e l’importanza della parte utilizzata, in rapporto all’insieme dell’opera protetta; 4) quali conseguenze sul mercato o sul valore dell’opera possono scaturire dall’utilizzo dell’opera stessa. Alla luce di questi quattro criteri vi è più di un dubbio (eufemisticamente parlando) sul fatto che il text e data mining utilizzato per l’addestramento dei sistemi di IA sia basato sul fair use americano. Posto infatti che, lo ribadiamo, questo istituto è proprio del sistema americano (e non di altri sistemi come quello italiano), i giudici investiti di tali cause hanno finora ritenuto inammissibile l’applicazione della suddetta eccezione per casi del genere.
A ciò va aggiunto che è cosa nota che l’addestramento dei sistemi viene spesso fatto attraverso il web scraping ovverosia quella tecnica non del tutto legale per cui una macchina è in grado di “rastrellare” informazioni presenti sui siti web attraverso comportamenti emulativi della navigazione. In sintesi, il pensiero comune va infatti verso tutt’altra direzione, quella che prevede che gli sviluppatori di IA dovrebbero assicurarsi di ottenere preventivamente il permesso dagli autori o dai titolari dei diritti per utilizzare tali opere nei processi di addestramento. Alcuni esperti propongono la creazione di licenze ad hoc che permettano l’uso delle opere per scopi di addestramento dell’IA; per altri una soluzione plausibile (e che si sta rafforzando sul piano internazionale) potrebbe essere un sistema di equo compenso, sulla scorta di quanto già visto per la copia privata ad uso personale. L’unica cosa certa finora è che siamo di fronte a un problema nuovo e che verosimilmente dovrà essere nuova la soluzione che i legislatori adotteranno.
Va anche segnalato che – a parte il recente cambio di rotta nella politica USA che appare muoversi verso maggiori libertà per i colossi del digitale, a danno di creativi e industria culturale, da monitorare nei suoi prossimi sviluppi – un tentativo nel Regno Unito, pochi mesi fa, di subordinare normativamente (si trattava di proposte) il copyright alle esigenze del mercato AI è stato sonoramente bocciato da chi detiene e sfrutta il copyright dei propri cataloghi.
L’originalità delle opere create da IA generativa (output)
Un altro tema centrale riguarda la protezione delle opere create da IA generativa, gli output generati dagli utenti inserendo i prompt. Le norme sul diritto d’autore stabiliscono che per poter godere della protezione giuridica, un’opera deve essere originale, cioè, deve esprimere un carattere creativo. Ma è possibile applicare questo concetto di originalità alle creazioni generate da un algoritmo di intelligenza artificiale?
Il requisito di originalità è tradizionalmente legato alla presenza di un intervento umano nella creazione dell’opera. Tuttavia, quando l’IA è coinvolta nella creazione, la questione si complica (premesso che la macchina, da sola, non è mai ammissibile come “creatrice”). Sebbene l’IA possa produrre composizioni musicali complesse, il grado di “creatività” che l’IA stessa può esprimere è tuttora oggetto di dibattito. In generale, le opere generate da IA non possono essere considerate originali in senso tradizionale, poiché il processo creativo risiede nell’algoritmo e nei dati di addestramento che vengono stimolati dal prompt impartito dall’utente che non necessariamente è frutto di un lavoro creativo dello stesso: del resto basta dare degli input anche banali a un sistema di IA generativa per vedersi sfornare un’opera musicale (composizione e anche fonogramma) completa di intro, strofa, ritornello, bridge e chi più ne ha più ne metta! D’altra parte, a mente di quanto stabilito dalle leggi in materia di copyright se un’opera generata dall’IA non soddisfacesse il requisito dell’originalità, non riceverebbe protezione ai sensi della legge sul diritto d’autore.
Anche qui il dibattito è abbastanza acceso: c’è chi sostiene che, a prescindere dallo sforzo dell’utente in fase di elaborazione del prompt, queste opere e questi fonogrammi non meritano tutela (ad es. SCF – Società Consortile Fonografici ha di recente stabilito la limitazione del mandato per i fonogrammi integralmente prodotti da sistemi di intelligenza artificiale), c’è chi sostiene che invece va fatta una valutazione caso per caso in relazione al gradiente di creatività profusa nell’opera dalla persona che la ha creata (su questo aspetto v’è anche già una pronuncia utile di giurisprudenza italiana – vedi l’ordinanza della Cassazione n.1107/2023).
Anche su questo tema sarà il tempo a darci delle risposte più certe. Verosimilmente una soluzione potrà essere quella della “via di mezzo” e cioè di attribuire – per legge – alle opere e ai contenuti generati da sistemi di IA (cosiddetto “output”) una tutela di durata inferiore, sempre nel momento in cui l’autore sia comunque in grado di dimostrare il proprio apporto creativo nella generazione del contenuto in parola.
Facciamo un esempio: poniamo un musicista che utilizza un’intelligenza artificiale per generare una nuova composizione musicale. L’utente inserisce un prompt come “componi una canzone pop con un’intro di 10 secondi, una strofa, un ritornello energico e un bridge in stile anni ’70“. L’IA, utilizzando il suo algoritmo e i dati con cui è stata addestrata, crea una canzone (sia opera musicale che fonografica, si badi, sebbene qui per semplificare trattiamo solo dell’aspetto compositivo) che soddisfa i criteri del prompt. Sebbene la composizione possa essere tecnicamente complessa, il contributo creativo del musicista potrebbe essere minimo, in quanto l’IA avrebbe determinato gran parte della struttura musicale (melodia e testo, principalmente) sulla base di dati e algoritmi.
In questo caso la questione dell’originalità si pone: secondo la normativa, l’opera potrebbe non essere considerata originale nel senso tradizionale, poiché la creatività principale risiederebbe nello strumento IA e nei relativi dati di addestramento, non nel contributo umano diretto. Se il musicista non ha apportato un intervento creativo significativo (per esempio scegliendo in modo sostanziale le melodie o riarrangiando significativamente la composizione), potrebbe risultare difficile applicare il diritto d’autore a questa composizione musicale. Se fosse così, il musicista prompter non potrebbe rivendicare diritti su quest’opera (anche se il contratto di servizio dello strumento IA affermasse che tutti i diritti spettano all’utente) e, pertanto, nemmeno depositarla in SIAE o altra collecting, né sfruttarla sulla base di requisiti di creatività.
Si pensi infine al fatto che lo stesso, identico prompt potrebbe dare luogo a output diversi, a opere del tutto differenti, a causa di variabili sempre presenti in questo tipo di sistemi.
Come riconoscere un’opera generata da IA?
Altro tema interessante e strettamente collegato a quello appena trattato è quello legato alla domanda “come faccio a sapere se un brano musicale è stato creato grazie all’IA?”. La soluzione più ovvia, teoricamente, sarebbe quella di cercare la risposta all’interno dell’IA stessa: creare e sfruttare altri software di intelligenza artificiale che riescono a scovare quali contenuti sono stati creati grazie ai sistemi di intelligenza artificiale generativa. In realtà la storia ci insegna che una soluzione del genere potrebbe durar poco o comunque non essere stabile nel lungo periodo… “basterebbe” infatti trovare quell’escamotage grazie al quale il nostro contenuto creato dall’IA non sia riconoscibile dall’IA stessa per complicare le cose!
Casi giudiziari rilevanti: l’esperienza statunitense attuale
Passando all’ultimo tema, in tempi recenti, diversi procedimenti legali, soprattutto negli Stati Uniti, hanno messo in luce le problematiche relative all’uso non autorizzato di opere protette da IA generativa. Molti di questi casi sono ancora in fase di definizione. Al momento in cui scriviamo vogliamo segnalare, tra i tanti, i casi “RIAA” vs Suno AI” e “RIAA vs Udio AI”.
La Recording Industry Association of America® (RIAA) ha difatti instaurato due giudizi per violazione del diritto d’autore fondati sulla violazione di massa di registrazioni sonore protette da copyright copiate e sfruttate senza autorizzazione da due servizi di generazione musicale multimilionari, Suno e Udio. Le rivendicazioni riguardano registrazioni di artisti di più generi, stili ed epoche. Con questa causa la RIAA vuole non solo chiedere un risarcimento per le innumerevoli riproduzioni dei fonogrammi che sono state effettuate per addestrare i predetti sistemi IA ma vuole altresì dare un segnale al fine di contrastare l’uso smodato dell’IA che, da un lato, funzionano grazie all’ingestione di un’innumerevole quantità di dati fatta a danno degli aventi diritto e, dall’altro, rischiano di saturare il mercato con contenuti generati dalle macchine che entreranno in diretta concorrenza con gli artisti, sminuendo e alla fine soffocando le registrazioni sonore “autentiche”.
Indicazioni pratiche per l’uso responsabile dell’IA generativa
Venendo ad alcune indicazioni pratiche per poter “maneggiare” oggi strumenti di AI e i contenuti, stante l’incertezza attuale, ci possiamo limitare qui ad alcune indicazioni prudenziali minime:
- Verifica delle licenze: se possibile, assicurarsi che i contenuti utilizzati per l’addestramento siano stati trattati in forza di licenze adeguate o delle eccezioni previste dalla legge;
- Uso consapevole dei prompt: considerare con attenzione gli input forniti all’IA, evitando di generare (volutamente) contenuti che possano violare diritti di terzi;
- Valutazione del contenuto generato: verificare, per quanto possibile, se l’output generato dall’IA include elementi riconducibili ad opere protette, utilizzando strumenti di analisi specifici;
- Documentazione delle attività: tenere traccia dei processi di creazione e delle fonti utilizzate per garantire maggiore trasparenza in caso di controversie;
- Verifica delle condizioni di contratto: controllare se e come le (vigenti) condizioni di contratto del servizio AI utilizzato disciplinano i contenuti ottenuti (con particolare attenzione alla titolarità dei diritti d’autore sui materiali generati, alle eventuali limitazioni d’uso e alle clausole di responsabilità per utilizzi impropri);
- Nel caso di utilizzo con effetti verso terzi dei contenuti generati (per es. licenziati o venduti a produttori o editori musicali): dichiarare il contributo impiegato di servizi AI, con relativi dettagli (servizio, condizioni, apporto effettivo, ecc.).
Conclusioni (temporanee)
L’intelligenza artificiale generativa sta aprendo nuove opportunità nel settore musicale, ma al contempo solleva questioni giuridiche complesse, soprattutto riguardo al diritto d’autore e all’uso di contenuti protetti. Gli sviluppatori di IA devono essere consapevoli dei rischi legali legati all’addestramento degli algoritmi su materiale protetto senza le necessarie licenze. Al tempo stesso, le opere generate da IA potrebbero non soddisfare il requisito di originalità richiesto dalla legge italiana sul diritto d’autore e, come se non bastasse, il rischio di subire un takedown o una richiesta di risarcimento per aver creato un’opera musicale che in realtà contiene contenuti protetti di altri aventi diritto è sempre dietro l’angolo!
I procedimenti legali in corso, sia a livello nazionale che internazionale, potrebbero aiutare a definire maggiormente i contorni per l’uso di IA nella creazione di contenuti musicali. Tuttavia, la strada da percorrere sembra ancora lunga sebbene la tecnologia vada avanti inesorabilmente. È imperativo che ci si tenga aggiornati sulle evoluzioni normative e giurisprudenziali sul tema, come visto il tema è caldo e mutevole. Così come i possibili rischi non sono trascurabili.
Autori: Avv. Gianmaria Le Metre, Avv. Andrea Michinelli