Logo Zéphyrnet

Les auteurs poursuivent Nvidia pour droit d'auteur dans AI NeMo Megatron

Date :

Trois auteurs ont poursuivi le géant de la fabrication de puces, Nvidia, pour avoir prétendument utilisé leurs œuvres protégées par le droit d'auteur sans leur autorisation pour former sa plateforme d'IA NeMo Megatron.

Selon les arguments des auteurs, le NeMo Megatron-GPT de Nvidia, sorti en 2022, « copie et tire de leurs livres sans consentement, crédit ou compensation ».

Les scribes réclament désormais des « dommages-intérêts non spécifiés » pour les personnes dont le travail a été utilisé pour former NeMo au cours des trois dernières années.

Cela s'ajoute à une liste d'autres poursuites contre des sociétés d'IA pour des allégations de violations du droit d'auteur, car elles ont formé leurs modèles à l'aide d'informations supprimées sur Internet sans consentement.

Des centaines de milliers de livres utilisés

Les auteurs Brian Keene, Abdi Nazemian et Stewart O'Nan affirment que leurs travaux faisaient partie d'un ensemble de données d'environ 196,640 XNUMX livres utilisés pour entraîner la plate-forme NeMo AI de Nvidia à simuler un langage écrit ordinaire.

Selon Reuters, ont-ils déclaré, c’était avant qu’ils ne soient retirés en octobre « en raison de Violation du droit d'auteur. »

Dans leur dossier, les auteurs ont également indiqué que le retrait de Nvidia était un signe qu'ils admettaient qu'ils avaient violé les droits d'auteur des auteurs lors de la formation de NeMo.

Le procès, déposé vendredi à San Francisco, couvre le roman de Keene de 2008 intitulé « Ghost Walk », « Like a Love Story » écrit par Nazemian en 2019, et la nouvelle d'O'Nan de 2007 « Last Night at the Lobster ».

"Pendant la formation, le LLM copie et ingère chaque œuvre textuelle de l'ensemble de données de formation et en extrait l'expression protégée", lit partie de la plainte.

Selon Fox Business, les auteurs affirment dans leur procès que les livres se trouvaient dans une donnée connue sous le nom de The Pile « qui contenait une collection de livres appelée « Books3 ». Nvidia a cependant admis avoir entraîné ses modèles NeMo Megatron AI « sur The Pile et les trois livres ».

Le livre de la pile3

Selon PCMag, The Pile – qui a été utilisé pour entraîner NeMo Megatron comprend 800 Go de données. Cela comprend 108 Go de livres, comme indiqué dans le procès des auteurs.

Sa composante livres s'appelle « Books3 » et compte plus de 196,000 XNUMX livres sur « Bibliotik », y compris les livres des trois auteurs.

Comme l'ont indiqué les auteurs, Pile's Books3 était répertorié sur Étreindre le visage jusqu'en octobre de l'année dernière, lorsque l'ensemble de données a été supprimé avec le message « est obsolète et n'est plus accessible en raison d'une violation du droit d'auteur signalée ».

A lire également: Les LLM arrivent sur les ordinateurs portables : les PDG de Nvidia et HP célèbrent les PC IA

Des litiges croissants de la part des écrivains

Un porte-parole de Nvidia a toutefois déclaré que le fabricant de puces se conformait aux lois et réglementations.

"Nous respectons les droits de tous les créateurs de contenu et pensons avoir créé NeMo en totale conformité avec la loi sur le droit d'auteur", a déclaré le porte-parole à PCMag par e-mail.

Le dernier procès ajoute Nvidia à une liste croissante de litiges intentés par des écrivains et des éditeurs.

Nvidia a présenté sa plateforme d'IA NeMo comme le « moyen rapide et abordable d'adopter l'IA générative », la technologie capable de créer de la prose, de composer des paroles, de créer des images ou des vidéos et d'écrire des poèmes.

Nvidia n’est pas la seule entreprise d’IA à faire face à des poursuites. Créateur ChatGPT OpenAI et ses bailleurs de fonds Microsoft ont un projet en attente procès pour violation de droits par le New York Times.

Mais ce n'est pas tout. Récemment, des artistes se sont également prononcés en faisant part de leurs inquiétudes quant au fait que le créateur d'images génératif d'IA À mi-parcours utilise également «leurs styles uniques pour créer des résultats tirés de leur travail sans leur consentement, le qualifiant de déshumanisant et irrespectueux».

spot_img

Dernières informations

spot_img