Rapport : Un procès potentiel du NYT pourrait forcer OpenAI à effacer ChatGPT et à recommencer

Benj Edwards/Getty Images

Quelques semaines après que le New York Times a mis à jour ses conditions de service (TOS) pour interdire aux sociétés d’IA de gratter ses articles et ses images pour former des modèles d’IA, il semble que le Times se prépare à poursuivre OpenAI. Le résultat, selon les experts, pourrait être dévastateur pour OpenAI, y compris la destruction de l’ensemble de données de ChatGPT et des amendes pouvant atteindre 150 000 $ par élément de contenu contrefait.

NPR s’est entretenu avec deux personnes « ayant une connaissance directe » qui ont confirmé que les avocats du Times se demandaient si une action en justice pourrait être nécessaire « pour protéger les droits de propriété intellectuelle » des reportages du Times.

Ni OpenAI ni le Times n’ont immédiatement répondu à la demande de commentaires d’Ars.

Si le Times devait suivre et poursuivre OpenAI, le fabricant de ChatGPT, NPR a suggéré que le procès pourrait devenir la bataille juridique « la plus médiatisée » à ce jour sur la protection des droits d’auteur depuis le lancement extrêmement populaire de ChatGPT. Cette spéculation survient un mois après que Sarah Silverman a rejoint d’autres auteurs populaires poursuivant OpenAI pour des préoccupations similaires, cherchant à protéger le droit d’auteur de leurs livres.

Bien sûr, ChatGPT n’est pas le seul outil d’IA génératif à susciter des contestations judiciaires concernant les revendications de droits d’auteur. En avril, des experts ont déclaré à Ars que le générateur d’images Stable Diffusion pourrait être un « séisme juridique » en raison de problèmes de droits d’auteur.

Mais OpenAI semble être une cible de choix pour les premières poursuites, et NPR a rapporté qu’OpenAI risquait qu’un juge fédéral ordonne la reconstruction complète de l’ensemble de données de ChatGPT – si le Times prouve avec succès que l’entreprise a copié son contenu illégalement et que le tribunal limite les modèles de formation OpenAI à n’incluent que des données explicitement autorisées. OpenAI pourrait faire face à d’énormes amendes pour chaque élément de contenu contrefait, infligeant à OpenAI un coup financier massif quelques mois seulement après que le Washington Post a rapporté que ChatGPT avait commencé à se débarrasser d’utilisateurs, « ébranlant la foi dans la révolution de l’IA ». Au-delà de cela, une victoire judiciaire pourrait déclencher une avalanche de revendications similaires de la part d’autres titulaires de droits.

Contrairement aux auteurs qui semblent plus soucieux de conserver la possibilité de supprimer leurs livres des modèles de formation d’OpenAI, le Times a d’autres préoccupations concernant les outils d’IA comme ChatGPT. NPR a signalé qu’une « préoccupation majeure » est que ChatGPT pourrait utiliser le contenu du Times pour devenir un « concurrent » en « créant un texte qui répond aux questions sur la base des rapports et de l’écriture originaux du personnel du journal ».

Depuis ce mois-ci, le TOS du Times interdit toute utilisation de son contenu pour « le développement de tout programme logiciel, y compris, mais sans s’y limiter, la formation d’un système d’apprentissage automatique ou d’intelligence artificielle (IA) ».

Il semble maintenant clair que cette mise à jour offre au Times une couche de protection supplémentaire, car NPR rapporte que le média est apparemment en train de reconsidérer un accord de licence avec OpenAI. Cet accord de licence aurait permis à OpenAI de payer le contenu du NYT utilisé pour former ses modèles. Selon NPR, les réunions entre OpenAI et le Times sont devenues « controversées », ce qui rend l’accord de plus en plus improbable alors que le Times se demande apparemment si un accord de licence vaudrait la peine d’y participer, car le produit résultant pourrait devenir son concurrent le plus féroce.

Pour défendre ses modèles de formation à l’IA, OpenAI devrait probablement revendiquer une « utilisation équitable » de tout le contenu Web que l’entreprise a aspiré pour former des outils comme ChatGPT. Dans le cas potentiel du New York Times, cela signifierait prouver que copier le contenu du Times pour élaborer des réponses ChatGPT ne serait pas en concurrence avec le Times.

Les experts ont déclaré à NPR que ce serait un défi pour OpenAI, car contrairement à Google Books, qui a remporté une contestation fédérale du droit d’auteur en 2015 parce que ses extraits de livres ne créaient pas un « substitut de marché significatif » pour les livres réels, ChatGPT pourrait en fait remplacer pour certains internautes le Le site Web du Times comme source de ses reportages.

Les avocats du Times semblent penser qu’il s’agit d’un risque réel, et NPR a rapporté qu’en juin, les dirigeants du NYT ont publié une note de service au personnel qui semble être un avertissement précoce de ce risque. Dans le mémo, le directeur des produits du Times, Alex Hardiman, et le rédacteur en chef adjoint Sam Dolnick ont ​​déclaré que l’une des principales « craintes » pour l’entreprise était de « protéger nos droits » contre les outils d’IA génératifs.

« Comment pouvons-nous nous assurer que les entreprises qui utilisent l’IA générative respectent notre propriété intellectuelle, nos marques, nos relations avec les lecteurs et nos investissements ? » a demandé le mémo, faisant écho à une question soulevée dans les salles de rédaction qui commencent à peser les avantages et les risques de l’IA générative.

Le mois dernier, l’Associated Press est devenue l’une des premières agences de presse à conclure un accord de licence avec OpenAI, mais les termes de l’accord n’ont pas été divulgués. Aujourd’hui, AP a indiqué qu’elle s’était jointe à d’autres organes de presse pour développer des normes d’utilisation de l’IA dans les salles de rédaction, reconnaissant que de nombreux « organes de presse s’inquiètent de l’utilisation de leur matériel par des entreprises d’IA sans autorisation ni paiement ».

En avril, la News Media Alliance a publié les principes de l’IA, cherchant à défendre la propriété intellectuelle des éditeurs en insistant sur le fait que « les développeurs et les déployeurs d’IA générative doivent négocier avec les éditeurs le droit d’utiliser » le contenu des éditeurs pour la formation à l’IA, les outils d’IA faisant apparaître des informations et Outils d’IA synthétisant des informations.

Ars n’a pas pu joindre immédiatement la News Media Alliance pour commenter l’impact potentiel de l’affaire NYT.

Source-147