Logo Zephyrnet

Il Congresso ha affermato che le aziende di intelligenza artificiale dovrebbero pagare per i contenuti protetti da copyright

Data:

Le aziende tecnologiche dovrebbero compensare gli editori di notizie per la formazione di modelli di intelligenza artificiale sui loro contenuti protetti da copyright, hanno detto ai senatori esperti dei media in un’audizione questa settimana.

La commissione giudiziaria del Senato americano leader interrogati dalle associazioni di categoria dei media e dal mondo accademico su come l’intelligenza artificiale generativa influisce sull’industria del giornalismo.

Il giornalismo si è sempre adattato man mano che vengono inventate nuove tecnologie. L’ascesa di Internet ha tagliato i giornali e spinto la parola scritta online. Gli editori modificano le loro strategie editoriali per apparire in cima alle classifiche di Google, attirando lettori e inserzionisti digitali. Ma come si comporteranno rispetto a modelli linguistici di grandi dimensioni in grado di generare automaticamente testo?

Addestrati su enormi quantità di Internet, i modelli di intelligenza artificiale generativa possono produrre tutti i tipi di contenuti. IL Il New York Times ha recentemente citato in giudizio OpenAI, accusando la startup di aver sottratto illegalmente "milioni di [suoi] articoli di notizie, indagini approfondite, articoli di opinione, recensioni, guide pratiche e altro ancora protetti da copyright".

Non solo si ritiene che OpenAI abbia rubato il suo lavoro, ma il New York Times ha affermato che ora ne sta approfittando ingiustamente generando passaggi dei suoi articoli parola per parola, consentendo ai netizen di eludere il suo paywall. Nel tentativo di riconquistare un po’ di potere da parte delle aziende tecnologiche, gli editori stanno ora lottando per ottenere compensi e cercando di negoziare accordi di licenza. Ma è una battaglia difficile da vincere, soprattutto se la legge potrebbe non essere dalla loro parte.

Non è chiaro se l’intelligenza artificiale generativa violi le attuali leggi sul copyright. Gli sviluppatori dei modelli ritengono che il loro utilizzo dei contenuti raschiato da Internet dovrebbero essere protetti dal fair use poiché i loro chatbot creano e producono testo che trasforma e trascende il materiale originale. OpenAI ha insistito che ChatGPT rigurgitasse contenuti protetti da copyright fosse un "bug raro".

Roger Lynch, amministratore delegato della casa editrice Condé Nast, non è d'accordo. “Il fair use è consentire critiche, parodie, borse di studio, ricerche, notizie”, ha detto ai senatori. "La legge è chiara quando si verifica un effetto negativo sul mercato del materiale protetto da copyright... Il fair use non è inteso semplicemente ad arricchire le aziende tecnologiche che preferiscono non pagare."

Esistono altri modi in cui strumenti come ChatGPT possono intaccare i profitti degli editori oltre alla riproduzione delle loro storie. Danielle Coffey, CEO dell'associazione di categoria News/Media Alliance, ha osservato che i chatbot progettati per scansionare il web e agire come un motore di ricerca, come Microsoft Bing o Perplexity, possono anche riassumere gli articoli.

I lettori potrebbero chiedere loro di estrarre e condensare le informazioni dalle notizie, il che significa che ci sarebbero meno incentivi per le persone a visitare i siti degli editori, con una conseguente perdita di traffico e di entrate pubblicitarie. “Non ci sarebbe alcun modello di business per noi in quell’ecosistema”, ha detto durante l’udienza.

Gli accordi di licenza manterranno a galla l’industria del giornalismo poiché darebbero ai media un modo per guadagnare denaro dall’intelligenza artificiale generativa. Gli accordi devono essere negoziati in modo da non impedire agli sviluppatori più piccoli di costruire i propri modelli linguistici di grandi dimensioni. Jeff Jarvis, recentemente in pensione dalla Newmark Graduate School of Journalism della City University di New York, è contrario alla concessione di licenze per tutti gli usi e teme che possa creare precedenti che potrebbero influenzare i giornalisti e le piccole aziende open source in competizione con le Big Tech.

È difficile trovare un modo equo per compensare gli editori senza sapere quali contenuti e quanto siano stati utilizzati per addestrare esattamente i modelli di intelligenza artificiale. Coffey ha avanzato l'idea che le aziende tecnologiche dovrebbero costruire un database consultabile che cataloghi tutti i siti web che sono stati cancellati. Le aziende di intelligenza artificiale potrebbero sostenere che è troppo complicato e macchinoso ordinare le enormi quantità di testo che hanno accumulato nel tempo.

Rivelare le loro fonti potrebbe far sembrare pessimi anche i loro strumenti di intelligenza artificiale, considerando la quantità di testo inappropriato che i loro modelli hanno ingerito, comprese le informazioni personali delle persone e i contenuti tossici o NSFW.

“L’idea che l’industria tecnologica stia dicendo che è troppo complicato ottenere la licenza da una tale gamma di proprietari di contenuti non regge”, ha affermato Curtis LeGeyt, presidente e CEO della National Association of Broadcasters. “Negli ultimi trent’anni le emittenti televisive locali hanno letteralmente stretto migliaia di accordi con sistemi via cavo e via satellite in tutto il paese per la distribuzione dei loro programmi”.

Lynch ha esortato il Congresso a chiarire che la formazione sui materiali protetti da copyright è illegale e non è un uso corretto. LeGeyt, tuttavia, ha affermato che l'approvazione di una nuova legislazione per chiarire la questione potrebbe essere prematura se può essere risolta attraverso un contenzioso. “Se abbiamo chiarezza sul fatto che le leggi attuali si applicano all’intelligenza artificiale generativa, lasciamo che il mercato funzioni. Se è una corsa agli armamenti tra chi può spendere di più in contenzioso, sappiamo che l’industria tecnologica batte tutti gli altri”.

Sebbene aziende come OpenAI ritengano che la formazione rientri nel fair use, la startup sta agendo con maggiore cautela man mano che il numero di cause legali contro di essa si accumula. Finora ha ottenuto accordi di licenza con l'Associated Press, Axel Springer, e lo è riferito in trattative con CNN, Fox Corp e Time. 

"Anche se negoziano con noi, il loro punto di partenza è 'non vogliamo pagare per contenuti che sappiamo che dovremmo essere in grado di ottenere gratuitamente'", ha detto Lynch. Se le aziende tecnologiche riuscissero a ottenere ciò che volevano e i tribunali decidessero che l’intelligenza artificiale generativa non viola il diritto d’autore, dovrebbero comunque pagare gli editori per l’utilizzo dei loro materiali, ha affermato LeGeyt.

“Queste tecnologie dovrebbero concedere in licenza i nostri contenuti. In caso contrario, il Congresso dovrebbe agire”, ha esortato i senatori. ®

spot_img

L'ultima intelligenza

spot_img