Tickets coming soon
An event powered by
Cerca
Close this search box.

Intelligenza Artificiale: quella di Google converte testi in musica

Una nuova intelligenza artificiale di Google può generare musica da un qualsiasi testo

Google però vuole indagarne meglio i rischi e per ora ha deciso di non rilasciarla pubblicamente

 

Google ha presentato i risultati di un sistema di Intelligenza Artificiale capace di generare musica di qualsiasi genere partendo da un testo scritto. 

Si chiama MusicLM e il suo funzionamento è simile a quello di piattaforme come Dall-E, che creano immagini e opere artistiche basandosi su esempi di parole e descrizioni. 

L’intelligenza di MusicLM è stata “addestrata” su 280.000 ore di musica, con Google che ha pubblicato alcuni esempi dei lavori composti, senza però rilasciare il sistema pubblicamente per via degli eventuali problemi di copyright che potrebbe generare – e che la stessa Google ha tutto l’interesse a comprendere al meglio, considerato che controlla già piattaforme come Youtube.. Negli Stati Uniti, infatti, un collettivo di artisti ha già avviato una class action contro aziende che usano tecniche di intelligenza artificiale per creare immagini e la situazione potrebbe facilmente replicarsi con esponenti dell’industria musicale.

credit: Google

Intelligenza Artificiale: sviluppo inarrestabile

L’intento dei ricercatori è però quello di dimostrare il livello a cui lo sviluppo degli algoritmi è arrivato. MusicLM può non solo assemblare brani completi ma anche convertire fischiettii e motivetti cantati in musica strumentale suonata da strumenti diversi, a scelta tra un set di disponibili.

Quello di Google, ad ogni modo, non è certamente il primo sistema di intelligenza artificiale generativa per la canzone. Ne avevamo parlato recentemente anche qui > https://makerfairerome.eu/it/intelligenza-artificiale-canta-e-fa-100-milioni-di-ascolti/

A settembre del 2016, i Sony Computer Science Laboratories hanno pubblicato “Daddy’s Car”, una traccia interamente composta da un’intelligenza artificiale e ispirata alle musiche dei Beatles.

Ci sono stati altri tentativi, tra cui Riffusion, un’intelligenza artificiale che compone musica visualizzandola, così come Dance Diffusion, AudioML di Google e Jukebox di OpenAI. Ma a causa di limiti tecnici e dati di formazione limitati, nessuno è stato in grado di produrre canzoni particolarmente complesse nella composizione o ad alta fedeltà. MusicLM è forse il primo che può farlo.

foto: Mohammed Metri via Unsplash

Come funziona MusicLM

Descritto in dettaglio in un paper accademico, MusicLM è stato addestrato su un set di dati di 280.000 ore di musica per imparare a generare brani coerenti con descrizioni di – come affermano i creatori – “significativa complessità” (ad esempio “incantevole canzone jazz con un memorabile assolo di sassofono e un cantante solista” o “la techno berlinese degli anni ’90 con un basso basso e un calcio forte”). Le sue canzoni, straordinariamente, suonano come qualcosa che un artista umano potrebbe comporre, anche se non appaiono ancora necessariamente così fantasiose o musicalmente coese.

Anche se richided ‘prompt’ (descrizioni) un po’ lunghe e tortuose, MusicLM riesce a catturare comunque molto bene sfumature come riff strumentali, melodie e stati d’animo.

Fischiettii e colonne sonore

Le capacità di MusicLM vanno oltre la generazione ‘ex novo’ di brevi clip di canzoni.

I ricercatori di Google hanno mostrato che il sistema può basarsi su melodie esistenti, canticchiate, cantate, fischiettate o suonate su uno strumento.

Inoltre, MusicLM può prendere diverse descrizioni scritte in sequenza (ad es. “tempo di meditare”, “tempo di svegliarsi”, “tempo di correre”, “tempo di dare il 100%”) e creare una sorta di “storia” melodica o narrativa che vanno fino a diversi minuti di lunghezza, perfettamente adatti per la colonna sonora di un film.

Musiche d’epoca e a tema

Non è tutto. MusicLM può anche essere istruito tramite una combinazione di immagini e didascalie o generare audio che viene “riprodotto” da un tipo specifico di strumento in un determinato genere. È possibile impostare anche il livello di esperienza del “musicista” AI e il sistema può creare musica ispirata a luoghi, epoche o esigenze (ad es. musica motivazionale per gli allenamenti).

foto: Possessed Photography via Unsplash

I problemi di MusicLM

Ma MusicLM non è impeccabile, tutt’altro. Alcuni dei campioni hanno una qualità distorta, un effetto collaterale inevitabile del processo di formazione. E mentre MusicLM può tecnicamente generare voci, comprese le armonie corali, lasciano molto a desiderare. La maggior parte dei “testi” spazia dall’inglese a malapena al puro incomprensibile, cantato da voci sintetizzate che suonano come fusioni di diversi artisti.

Le sfide etiche

Tuttavia, i ricercatori di Google notano le numerose sfide etiche poste da un sistema come MusicLM, inclusa la tendenza a incorporare materiale protetto da copyright dai dati di formazione nelle canzoni generate. Durante un esperimento, hanno scoperto che circa l’1% della musica generata dal sistema è stata replicata direttamente dai brani su cui si è formato, una soglia apparentemente abbastanza alta da scoraggiarli dal rilasciare MusicLM nel suo stato attuale.

“Riconosciamo il rischio di potenziale appropriazione indebita di contenuti creativi associati al caso d’uso”, hanno scritto i coautori dell’articolo. “Sottolineiamo con forza la necessità di più lavoro futuro per affrontare questi rischi associati alla generazione di musica”.

Supponendo che MusicLM o un sistema come questo sia un giorno reso disponibile, sembra inevitabile che emergano importanti problemi legali, anche se i sistemi sono posizionati come strumenti per assistere gli artisti piuttosto che sostituirli. Lo hanno già fatto, anche se attorno a sistemi di intelligenza artificiale più semplici.

Musica deepfake

Nel 2020, l’etichetta discografica di Jay-Z ha presentato un avvertimento sul copyright contro un canale YouTube, Vocal Synthesis, per aver utilizzato l’intelligenza artificiale per creare cover di Jay-Z di canzoni come “We Didn’t Start the Fire” di Billy Joel. Dopo aver inizialmente rimosso i video, YouTube li ha ripristinati, scoprendo che le richieste di rimozione erano “incomplete”. Ma la musica deepfaked si trova ancora su un oscuro terreno legale.

Il copyright

Un white paper scritto da Eric Sunray, legale della Music Publishers Association, sostiene che i generatori di musica AI come MusicLM violano il copyright musicale creando “tappezzerie di audio coerente dalle opere che ingeriscono durante la formazione, violando così la riproduzione dello United States Copyright Act Giusto.”

Dopo il rilascio di Jukebox, i critici si sono anche chiesti se l’addestramento di modelli di intelligenza artificiale su materiale musicale protetto da copyright costituisca un uso corretto. Preoccupazioni simili sono state sollevate in merito ai dati di addestramento utilizzati nei sistemi di intelligenza artificiale per la generazione di immagini, codice e testo, che vengono spesso cancellati dal Web all’insaputa dei creatori.

Il punto di vista degli utenti

Dal punto di vista dell’utente, si ipotizza che la musica generata da un sistema di intelligenza artificiale possa essere considerata un’opera derivata, nel qual caso solo gli elementi originali sarebbero protetti da copyright. Naturalmente, non è chiaro cosa possa essere considerato “originale” in tale musica; usare questa musica commercialmente significa entrare in acque inesplorate – e potenzialmente pericolose.

*******************************************

Potrebbe non passare molto tempo prima che sia fatta un po’ di chiarezza sulla questione. Diverse cause legali che si stanno facendo strada nei tribunali avranno probabilmente un impatto sull’intelligenza artificiale che genera musica, inclusa una relativa ai diritti degli artisti il cui lavoro viene utilizzato per addestrare i sistemi di intelligenza artificiale a loro insaputa o senza il loro consenso. Il tempo ce lo dirà; restiamo in attesa di sviluppi


 

Maker Faire Rome – The European Edition, promossa dalla Camera di Commercio di Roma, si impegna fin dalla sua prima edizione a rendere l’innovazione accessibile e fruibile, offrendo contenuti e informazioni in un blog sempre aggiornato e ricco di opportunità per curiosi, maker, Pmi e aziende che vogliono arricchire le proprie conoscenze ed espandere la propria attività, in Italia e all’estero.

Seguici, iscriviti alla nostra newsletter: ti forniremo solo le informazioni giuste per approfondire i temi di tuo interesse.