Logo Zephyrnet

Gli autori fanno causa a NVIDIA per aver addestrato l'intelligenza artificiale sui libri piratati

Data:

Casa > cause > App e siti >


Diversi autori hanno intentato un'azione legale collettiva per violazione del copyright contro il colosso della tecnologia NVIDIA, che guida la rivoluzione dell'intelligenza artificiale. Oltre a vendere hardware e servizi, NVIDIA dispone di propri modelli linguistici di grandi dimensioni. Gli autori sostengono che i modelli di intelligenza artificiale sono stati addestrati su opere protette da copyright prese dal sito "pirata" Bibliotik, e come tali hanno diritto a un risarcimento.

logo nvidiaA partire dallo scorso anno, diversi titolari dei diritti hanno presentato istanza cause contro le aziende che sviluppano modelli di intelligenza artificiale.

L'elenco dei denuncianti comprende etichette discografiche, autori di libri, artisti visivi e persino il New York Times. Tutti questi titolari dei diritti si oppongono al presunto utilizzo della loro opera senza un adeguato compenso.

“Libri3”

Molte delle cause legali intentate dagli autori di libri presentano una chiara prospettiva di pirateria. I casi sostengono che le aziende tecnologiche, tra cui Meta, Microsoft e OpenAI, abbiano utilizzato il controverso Set di dati "Libri3". per addestrare i loro modelli.

Books3 è stato creato dal ricercatore di intelligenza artificiale Shawn Presser nel 2020, che ha raschiato la biblioteca del sito "pirata" Bibliotik. Il set di dati è stato ampiamente condiviso online e aggiunto ad altri database tra cui "The Pile", un set di dati di addestramento sull'intelligenza artificiale compilato da EleutherAI.

Dopo shavasana, sedersi in silenzio; saluti; respingere dai titolari dei diritti e da organizzazioni antipirateria, Books3 è stato messo offline per problemi di copyright. Tuttavia, per molte delle aziende che presumibilmente hanno addestrato i propri modelli di intelligenza artificiale su di esso, ci sono ancora alcune ripercussioni legali da risolvere.

Gli autori fanno causa a NVIDIA per violazione del copyright

Venerdì autori americani Abdi Nazemiano, Brian Keenee Stewart O'Nan si è unito alla raffica di azioni legali con una causa per violazione del copyright contro NVIDIA. L’azienda, la cui capitalizzazione di mercato supera i 2 trilioni di dollari, è nota soprattutto per le sue GPU e i relativi software e servizi, ma ha anche i propri modelli di intelligenza artificiale.

In una concisa denuncia collettiva, depositata presso un tribunale federale della California, gli autori sostengono che NVIDIA abbia utilizzato il set di dati Books3 per addestrare i suoi NeMo Megatron modelli linguistici. I modelli sono ospitati su Hugging Face dove stati che sono addestrati sul set di dati "The Pile" di EleutherAI, che include i libri piratati.

nvidia

Facendo due più due, i querelanti concludono che i modelli di NVIDIA sono stati addestrati su libri piratati, compresi i loro, senza il loro permesso.

“NVIDIA ha ammesso di aver addestrato i suoi modelli NeMo Megatron su una copia del set di dati The Pile. Pertanto, NVIDIA ha necessariamente addestrato i suoi modelli NeMo Megatron su una copia di Books3, perché Books3 fa parte di The Pile", si legge nella denuncia.

"Alcuni libri scritti dai Querelanti fanno parte di Books3 - comprese le Opere violate - e quindi NVIDIA ha necessariamente addestrato i suoi modelli NeMo Megatron su una o più copie delle Opere violate, violando così direttamente i diritti d'autore dei Querelanti."

Danni per violazione diretta

Basandosi sulla stessa logica, gli autori accusano l'azienda di violazione diretta del copyright, sottolineando che NVIDIA ha copiato i loro libri per utilizzarli per scopi di formazione sull'intelligenza artificiale. Attraverso l'azione legale, i titolari dei diritti richiedono un risarcimento sotto forma di danni effettivi o legali.

L'azione legale collettiva comprende finora tre autori, ma altri potrebbero aggiungersi al caso man mano che procede. NVIDIA deve ancora rispondere alle accuse, ma alla luce di casi simili, probabilmente si opporrà alle affermazioni e/o sosterrà una difesa del fair use.

Il mese scorso OpenAI è riuscita a farlo 'sconfitta' diverse denunce di violazione del copyright da parte di autori di libri in una causa in qualche modo correlata "Books3". Tuttavia, la corte federale della California non ha esaminato le denunce di violazione diretta del copyright in questo caso, che devono ancora essere discusse in dettaglio in una fase successiva.

-

Una copia della denuncia collettiva contro NVIDIA, presentata dagli autori in un tribunale federale della California, è disponibile qui (pdf)

spot_img

L'ultima intelligenza

spot_img