Sarah Silverman poursuit OpenAI et Meta pour violation du droit d’auteur.

La comédienne et auteure Sarah Silverman, ainsi que les auteurs Christopher Golden et Richard Kadrey, poursuivent OpenAI et Méta chacun dans un tribunal de district américain sur double réclamation pour violation du droit d’auteur.

Les poursuites allèguent, entre autres, que ChatGPT d’OpenAI et LLaMA de Meta ont été formés sur des ensembles de données acquis illégalement contenant leurs œuvres, qui, selon eux, ont été acquis à partir de sites Web de «bibliothèque fantôme» tels que Bibliotik, Library Genesis, Z-Library et d’autres, notant les livres sont « disponibles en vrac via des systèmes torrent ».

Golden et Kadrey ont chacun refusé de commenter le procès, tandis que l’équipe de Silverman n’a pas répondu avant le temps de presse.

Dans le costume OpenAI, le trio propose des expositions montrant que lorsque vous y êtes invité, ChatGPT résumera leurs livres, enfreignant leurs droits d’auteur. Silverman’s Pipi au lit est le premier livre montré résumé par ChatGPT dans les expositions, tandis que le livre de Golden Ararat est également utilisé comme exemple, tout comme le livre de Kadrey Sandman Slim. La réclamation indique que le chatbot n’a jamais pris la peine de « reproduire aucune des informations de gestion des droits d’auteur que les demandeurs ont incluses avec leurs œuvres publiées ».

Quant au procès séparé contre Meta, il allègue que les livres des auteurs étaient accessibles dans les ensembles de données Meta utilisés pour former ses modèles LLaMA, un quatuor de modèles d’IA open source que la société a introduit en février.

La plainte explique par étapes pourquoi les plaignants pensent que les ensembles de données ont des origines illicites – dans un Méta papier détaillant LLaMA, la société indique des sources pour ses ensembles de données de formation, dont l’un s’appelle ThePile, qui a été assemblé par une société appelée EleutherAI. ThePile, souligne la plainte, a été décrit dans un Papier EleutherAI comme étant constitué à partir « d’une copie du contenu du tracker privé Bibliotik ». Bibliotik et les autres « bibliothèques fantômes » répertoriées, selon le procès, sont « flagrantement illégales ».

Dans les deux revendications, les auteurs disent qu’ils « n’ont pas consenti à l’utilisation de leurs livres protégés par le droit d’auteur comme matériel de formation » pour les modèles d’IA des entreprises. Leurs poursuites contiennent chacune six chefs d’accusation de divers types de violations du droit d’auteur, de négligence, d’enrichissement sans cause et de concurrence déloyale. Les auteurs demandent des dommages-intérêts légaux, la restitution des bénéfices, etc.

Les avocats Joseph Saveri et Matthew Butterick, qui représentent les trois auteurs, écrivent sur leur Site Web LLM Contentieux qu’ils ont entendu parler « d’écrivains, d’auteurs et d’éditeurs qui s’inquiètent [ChatGPT’s] capacité étonnante à générer un texte similaire à celui trouvé dans les documents textuels protégés par le droit d’auteur, y compris des milliers de livres.

Saveri a également engagé des poursuites contre des sociétés d’IA au nom de programmeurs et d’artistes. Getty Images a également déposé une plainte contre l’IA, alléguant que Stability AI, qui a créé l’outil de génération d’images IA Stable Diffusion, a formé son modèle sur « des millions d’images protégées par le droit d’auteur ». Saveri et Butterick représentent également les auteurs Mona Awad et Paul Tremblay dans un cas similaire sur le chatbot de l’entreprise.

Des poursuites comme celle-ci ne sont pas seulement un casse-tête pour OpenAI et d’autres sociétés d’IA ; ils défient les limites mêmes du droit d’auteur. Il y a Comme nous l’avons dit sur Le Vergecast chaque fois que quelqu’un incite Nilay à contester la loi sur le droit d’auteur, nous allons assister à des poursuites judiciaires centrées sur ce genre de choses pour les années à venir.

Nous avons contacté Meta, OpenAI et le cabinet d’avocats Joseph Saveri pour obtenir des commentaires, mais ils n’ont pas répondu avant l’heure de presse.

source site-132