Il devient de plus en plus difficile de suivre le rythme des poursuites en matière de droits d’auteur contre l’IA générative, avec un nouveau recours collectif proposé devant les tribunaux la semaine dernière. Cette fois, les auteurs poursuivent NVIDIA pour sa plateforme d’IA NeMo, un modèle de langage qui permet aux entreprises de créer et de former leurs propres chatbots, Ars Technica signalé. Ils affirment que l’entreprise l’a formé sur un ensemble de données controversées qui a utilisé illégalement leurs livres sans consentement.
Les auteurs Abdi Nazemian, Brian Keene et Stewart O’Nan ont exigé un procès devant jury et ont demandé à Nvidia de payer des dommages et intérêts et de détruire toutes les copies de l’ensemble de données Books3 utilisé pour alimenter les grands modèles de langage (LLM) de NeMo. Ils affirment que cet ensemble de données a copié une bibliothèque fantôme appelée Bibliotek, composée de 196 640 livres piratés.
« En résumé, NVIDIA a admis avoir entraîné ses modèles NeMo Megatron sur une copie de l’ensemble de données The Pile », indique la déclaration. « Par conséquent, NVIDIA a nécessairement également formé ses modèles NeMo Megatron sur une copie de Books3, car Books3 fait partie de The Pile. Certains livres écrits par les plaignants font partie de Books3, y compris les œuvres contrefaites, et NVIDIA a donc nécessairement formé ses modèles NeMo Megatron sur une ou plusieurs copies des Œuvres contrefaites, violant ainsi directement les droits d’auteur des Plaignants.
En réponse, NVIDIA a déclaré Le journal de Wall Street que « nous respectons les droits de tous les créateurs de contenu et pensons avoir créé NeMo en totale conformité avec la loi sur le droit d’auteur ».
L’année dernière, OpenAI et Microsoft ont été victimes d’une action en justice pour droits d’auteur de la part d’auteurs de non-fiction, affirmant que les entreprises gagnaient de l’argent grâce à leurs œuvres mais refusaient de les payer. Un procès similaire a été lancé plus tôt cette année. Cela s’ajoute à un procès intenté par des agences de presse comme L’interception et Histoire bruteet bien sûr, l’action en justice qui a déclenché tout cela depuis Le New York Times.