Un éditeur de presse dépose un recours collectif antitrust contre Google, invoquant les dommages causés à ses résultats par l’IA

Un nouveau recours collectif déposé cette semaine devant le tribunal de district américain de Washington accuse Google et sa société mère Alphabet de comportement anticoncurrentiel en violation de la loi antitrust américaine, du Sherman Act et d’autres, au nom des éditeurs de presse. L’affaire, déposée par l’éditeur Helena World Chronicle, basée en Arkansas, affirme que Google « siphonne » le contenu des éditeurs de presse, leurs lecteurs et les revenus publicitaires par des moyens anticoncurrentiels. Il cite également spécifiquement les nouvelles technologies d’IA telles que Search Generative Experience (SGE) de Google et le chatbot Bard AI comme aggravant le problème.

Dans la plainte, Helena World Chronicle, qui possède et publie deux hebdomadaires en Arkansas, affirme que Google « affame la presse libre » en partageant le contenu des éditeurs sur Google, leur faisant ainsi perdre « des milliards de dollars ».

Outre les nouvelles technologies d’IA, la poursuite pointe du doigt les anciennes technologies de questions-réponses de Google, comme le « Knowledge Graph » lancé en mai 2012, comme faisant partie du problème.

« Lorsqu’un utilisateur recherche des informations sur un sujet, Google affiche un « Knowledge Panel » à droite des résultats de recherche. Ce panneau contient un résumé du contenu tiré de la base de données Knowledge Graph », indique la plainte. « Google a compilé cette base de données massive en extrayant des informations des sites Web des éditeurs – ce que Google appelle des « documents partagés sur le Web » – et des « bases de données open source et sous licence » », indique-t-il.

En 2020, le Knowledge Graph comptait 500 milliards de faits sur 5 milliards d’entités. Mais une grande partie de « l’intelligence collective » exploitée par Google était du contenu « détourné des éditeurs », affirme la plainte.

D’autres technologies de Google, comme les « Featured Snippets » dans lesquels Google extrait de manière algorithmique les réponses des pages Web, ont également été citées comme détournant le trafic des sites Web des éditeurs.

Le plus important, peut-être, est que la poursuite aborde l’impact de l’IA sur les activités des éditeurs. Le problème a été récemment détaillé dans un rapport publié jeudi par le Wall St. Journal, qui présentait une statistique choquante. Lorsque le magazine en ligne The Atlantic a modélisé ce qui se passerait si Google intégrait l’IA dans la recherche, il a constaté que 75 % du temps, l’IA répondrait à la requête de l’utilisateur sans nécessiter de clic vers son site Web, ce qui entraînerait une perte de trafic. Cela pourrait avoir un impact majeur sur le trafic des éditeurs à l’avenir, puisque Google génère aujourd’hui près de 40 % de leur trafic, selon les données de SimilarWeb.

Certains éditeurs tentent désormais de devancer le problème. Par exemple, Axel Springer a signé cette semaine un accord avec OpenAI pour licencier ses actualités pour la formation de modèles d’IA. Mais dans l’ensemble, les éditeurs estiment qu’ils perdront entre 20 et 40 % du trafic de leur site Web lorsque les produits d’IA de Google seront pleinement déployés, note le rapport du WSJ.

Le procès réitère cette préoccupation, affirmant que les récentes avancées de Google en matière de recherche basée sur l’IA ont été mises en œuvre dans « le but de décourager les utilisateurs finaux de visiter les sites Web des membres du groupe qui font partie du secteur commercial de l’actualité et de l’édition numériques ».

SGE, affirme-t-il, offre aux internautes un moyen de rechercher des informations en mode conversationnel, mais en fin de compte, il maintient les utilisateurs dans le « jardin clos » de Google en « plagarisant » leur contenu. Les éditeurs ne peuvent pas non plus bloquer SGE, car il utilise le même robot d’exploration que le service de recherche général de Google, GoogleBot.

De plus, il indique que l’IA Bard de Google a été formée sur un ensemble de données comprenant « des actualités, des magazines et des publications numériques », citant à la fois un rapport de 2023 de la News Media Alliance et un article du Washington Post sur les données de formation de l’IA pour référence. (Le Post, qui a travaillé avec des chercheurs de l’Allen Institute for AI, avait découvert que les sites d’information et de médias constituaient la troisième plus grande catégorie de données de formation à l’IA.)

L’affaire met également en évidence d’autres préoccupations, comme la modification des tarifs AdSense et la preuve d’une spoliation inappropriée de preuves de la part de Google, par sa destruction des messages de chat – un problème soulevé dans le récent procès d’Epic Games contre Google pour des problèmes antitrust dans l’App Store, qu’Epic gagné.

En plus des dommages et intérêts, la poursuite demande une injonction qui obligerait Google à obtenir le consentement des éditeurs pour utiliser les données de leurs sites Web pour former ses produits généraux d’intelligence artificielle, y compris ceux de Google et ceux de ses concurrents. Il demande également à Google de permettre aux éditeurs qui se désengagent de SGE de continuer à apparaître dans les résultats de recherche Google, entre autres.

Le procès américain fait suite à un accord conclu le mois dernier par Google avec le gouvernement canadien, selon lequel le géant de la recherche paierait les médias canadiens pour l’utilisation de leur contenu. Selon les termes de l’accord, Google fournira chaque année 73,5 millions de dollars (100 millions de dollars canadiens) aux agences de presse du pays, les fonds étant distribués en fonction de l’effectif des médias. Les négociations avec Meta ne sont toujours pas résolues, même si Meta a commencé à bloquer les informations au Canada en août, à la lumière de la pression exercée pour payer le contenu en vertu de la nouvelle loi canadienne.

L’affaire arrive également parallèlement au dépôt du procès du ministère américain de la Justice contre Google pour monopolisation des technologies publicitaires numériques, et fait référence à la poursuite civile antitrust du ministère de la Justice de 2020 concernant la recherche et la publicité sur les recherches (qui sont des marchés différents des technologies publicitaires numériques dans le procès le plus récent). ).

« Les effets anticoncurrentiels du projet de Google causent un préjudice profond à la concurrence, aux consommateurs, aux travailleurs et à une presse libre et démocratique », lit-on dans un communiqué publié sur le site Internet du cabinet d’avocats chargé de l’affaire, Hausfeld.

« La plaignante Helena World Chronicle, LLC invoque le Sherman Act et le Clayton Act pour demander une réparation monétaire et une injonction à l’échelle collective afin de rétablir et d’assurer la concurrence pour l’édition numérique d’informations et de références et de mettre en place des garde-fous pour préserver un libre marché des idées dans la nouvelle ère de intelligence artificielle », indique-t-il.

Google a été invité à commenter, mais aucun n’a encore été fourni.

La plainte est disponible ci-dessous.

Helena World Chronicle, LLC contre Google LLC et Alphabet Inc par TechCrunch sur Scribd

Source-146