Logo Zéphyrnet

Nvidia trouve NeMo dans l'eau chaude alors que le géant des GPU et sa boîte à outils LLM sont poursuivis pour violation du droit d'auteur dans le cadre de la dernière d'une longue série de poursuites en matière d'IA.

Date :

Si vous avez déjà écrit un livre et l'avez publié professionnellement, vous saurez que votre travail est protégé par lois sur le droit d'auteur. Il existe des exemptions et des limitations, comme l’usage équitable, mais tout cela est très clair et strict. Cependant, trois auteurs américains ont intenté une action en justice, affirmant que Nvidia est coupable d'avoir enfreint ces lois en utilisant leurs travaux sans autorisation, pour former sa boîte à outils LLM appelée Némo.

Les modèles d'IA générative, tels que GPT-3, Llama et Dall-e, nécessitent d'énormes quantités de données pour les entraîner et permettre d'utiliser le modèle dans des outils comme ChatGPT et Copilote. Dans le cas de NeMo, il s'agit techniquement d'un cadre destiné aux développeurs d'IA, contribuant à faciliter la création, la modification et la distribution de leurs propres modèles de langage étendus (LLM).

Mais même ainsi, il doit encore suivre une formation en IA et Nvidia propose en outre une gamme de modèles pré-entraînés dans son service cloud. Le Reuters rapport sur le procès (via Seeking Alpha) est peu détaillé, mais l'affaire n'en est qu'à ses débuts puisqu'elle n'a été déposée que la semaine dernière. Les trois auteurs en question (Brian Keene, Abdi Nazemian et Stewart O'Nan) affirment que l'un des très grands ensembles de données utilisés par Nvidia pour sa formation contient des copies de leurs travaux publiés et que l'utilisation a été faite sans autorisation.

Normalement, dans de telles affaires juridiques, la défense se concentre sur le fait qu'il s'agit d'un exemple d'« utilisation équitable » et Meta est même allé jusqu'à dire qu'il s'agit essentiellement d'un « usage équitable ». pas différent de la façon dont un enfant apprend en étant exposé à la parole et au texte qui l'entourent.

En revanche, ceux qui ont intenté des poursuites dans le passé, comme le New York Times, ont déclaré qu'il s'agissait simplement du fait que le monde de l'IA n'était pas disposé à payer les frais dus pour des œuvres qui non seulement sont protégées par les lois sur le droit d'auteur, mais qui ont également correctement enregistré leur travail auprès des autorités compétentes.

Les accusés de l’IA générative ont généralement un point de vue différent : si vous avez lu une multitude de livres et que vous écrivez ensuite votre propre best-seller, votre travail viole-t-il le droit d’auteur ? Les LLM n'utilisent pas automatiquement des copies exactes du matériel utilisé dans la formation et si vous avez déjà utilisé quelque chose comme Diffusion stable et je lui ai dit de te dessiner un tableau célèbre, tu en auras un comme mais pas une image qui est une copie directe.

Il s'agit sans aucun doute d'une situation complexe, mais si ce recours collectif aboutit, il sera presque certainement suivi par d'innombrables autres, puisque l'ensemble de données en question utilisait près de 200,000 XNUMX romans, nouvelles, manuels, etc. Tout ce matériel est protégé par le droit d’auteur, même s’il n’est pas nécessairement entièrement enregistré.

Quoi qu’il en soit, le train des procès contre l’IA ne montre aucun signe de ralentissement et j’imagine qu’un grand nombre d’écrivains, d’artistes, de musiciens et de designers prêteront une attention particulière à l’issue de cette affaire particulière. Choo, choo !

spot_img

Dernières informations

spot_img