Sarah Silverman poursuit OpenAI et Meta pour violation du droit d’auteur

Sarah Silverman poursuit OpenAI. Vendredi, le comédien et auteur, aux côtés des romanciers Christopher Golden et Richard Kadrey, a déposé une paire de plaintes contre et Meta (). Le groupe allègue que les entreprises ont formé leurs grands modèles linguistiques sur des documents protégés par le droit d’auteur, y compris des œuvres qu’ils ont publiées, sans obtenir le consentement.

Les plaintes portent sur les ensembles de données qu’OpenAI et Meta auraient utilisés pour former ChatGPT et LLaMA. Dans le cas d’OpenAI, bien que son ensemble de données « Books1 » soit approximativement conforme à la taille du projet Gutenberg – un référentiel de livres bien connu et sans droit d’auteur – les avocats des plaignants soutiennent que les ensembles de données « Books2 » sont trop volumineux pour provenir de n’importe où autre que les soi-disant « bibliothèques fantômes » de matériel protégé par le droit d’auteur disponible illégalement, telles que Library Genesis et Sci-Hub. Les pirates de tous les jours peuvent accéder à ces documents via des téléchargements directs, mais peut-être plus utilement pour ceux qui génèrent de grands modèles de langage, de nombreuses bibliothèques fantômes mettent également à disposition des documents écrits dans des packages torrent en vrac. du procès de Silverman implique un échange entre les avocats du comédien et ChatGPT. L’équipe juridique de Silverman a demandé au chatbot de résumer L’énurésie, un mémoire qu’elle a publié en 2010. Le chatbot a non seulement pu décrire des parties entières du livre, mais certains passages qu’il a relayés semblent avoir été reproduits textuellement.

Silverman, Golden et Kadrey ne sont pas les premiers auteurs à poursuivre OpenAI pour violation du droit d’auteur. En fait, l’entreprise fait face à une foule de défis juridiques sur la façon dont elle a formé ChatGPT. En juin seulement, la société a reçu deux plaintes distinctes. L’un est un vaste recours collectif qui allègue qu’OpenAI a violé les lois fédérales et étatiques sur la confidentialité en grattant des données pour former les grands modèles de langage derrière ChatGPT et DALL-E.

Source-145