Google écope d’une amende de 270 millions de dollars en France alors que les autorités découvrent que les données des éditeurs de presse ont été utilisées pour Gemini

Dans une saga sans fin entre Google et l’autorité française de la concurrence sur la protection des droits d’auteur sur les extraits d’actualités, l’Autorité de la concurrence a annoncé mercredi une amende de 250 millions d’euros contre le géant de la technologie (environ 270 millions de dollars au taux de change d’aujourd’hui).

Selon l’organisme de surveillance de la concurrence, Google n’a pas tenu compte de certains de ses engagements antérieurs envers les éditeurs de presse. Mais la décision est particulièrement remarquable car elle abandonne quelque chose d’autre qui est tout à fait à jour : en s’appuyant sur l’utilisation par Google du contenu des éditeurs de presse pour former son modèle d’IA générative Bard/Gemini.

L’autorité de la concurrence a reproché à Google de ne pas avoir informé les éditeurs de presse de cette utilisation par GenAI de leur contenu protégé par le droit d’auteur. Cela s’inscrit dans le cadre des engagements antérieurs pris par Google, qui visent à garantir qu’il entame des négociations de paiement équitables avec les éditeurs concernant la réutilisation de leur contenu.

Atteintes au droit d’auteur et à la concurrence

En 2019, l’Union européenne a adopté une réforme paneuropéenne du droit d’auteur numérique qui a étendu la protection du droit d’auteur aux titres et extraits d’actualités. Les agrégateurs d’actualités, tels que Google News, Discover et la zone de fonctionnalité « Top Stories » sur les pages de résultats de recherche, avaient auparavant récupéré et affiché ces actualités sur leurs produits sans aucune compensation financière.

Google cherchait à l’origine à échapper à la loi en désactivant Google News en France. Mais l’autorité de la concurrence est rapidement intervenue, estimant que son action unilatérale constituait un abus de position dominante sur le marché qui risquait de nuire aux éditeurs. L’intervention a essentiellement contraint Google à conclure des accords avec des éditeurs locaux concernant la réutilisation du contenu. Mais en 2021, Google a été condamné à une amende de 592 millions de dollars après que l’autorité de la concurrence ait constaté des manquements majeurs dans ses négociations avec les éditeurs et agences locaux.

Le géant de la technologie a qualifié la sanction de « disproportionnée » et a annoncé qu’il ferait appel. Mais il a ensuite cherché à régler le différend en offrant une série d’engagements et en retirant son appel. Les engagements ont été acceptés par l’Autorité française, notamment la transmission des informations clés aux éditeurs et la négociation équitable.

Google a signé des accords de droits d’auteur avec des centaines d’éditeurs en France, qui relèvent de son accord avec l’Autorité. Son activité dans ce domaine est donc très strictement réglementée.

Pas d’appel

Google a accepté de ne pas contester les dernières conclusions de l’Autorité, en échange d’une procédure accélérée et d’un paiement monétaire.

Cependant, sa directrice générale des partenariats d’information et d’édition, Sulina Connal, a adopté un ton irrité – écrivant dans un long article de blog que « l’amende n’est pas proportionnée aux problèmes soulevés » par l’autorité.

Le billet de blog suggère que Google veut vraiment tirer un trait sur la saga cette fois-ci, Connal écrivant également : « Nous avons accepté parce qu’il est temps de passer à autre chose et, comme le montrent nos nombreux accords avec les éditeurs, nous voulons nous concentrer sur le plus grand. objectif d’approches durables pour connecter les gens avec un contenu de qualité et pour travailler de manière constructive avec les éditeurs français.

Avec l’IA générative dans le cadre et la ruée concurrentielle pour lancer des outils, le calcul de Google pour aborder le problème de la réutilisation du contenu semble différent.

Formation GenAI dans le cadre

L’application d’aujourd’hui par l’autorité française de la concurrence montre qu’elle s’est concentrée sur l’utilisation par Google du contenu des éditeurs et des agences de presse à des fins de formation pour son modèle de base d’IA et son service de chatbot d’IA associé, Bard (maintenant appelé Gemini).

Il a été constaté que Google utilisait le contenu d’éditeurs et d’agences de presse pour former Bard, son outil d’IA générative lancé en juillet 2023, « sans en informer les titulaires des droits d’auteur ni l’Autorité », selon son communiqué de presse.

Sur ce point, la défense de Google est double. Dans son article de blog, il écrit que l’autorité de la concurrence « ne remet pas en question la manière dont le contenu Web est utilisé pour améliorer de nouveaux produits comme l’IA générative, ce qui est déjà abordé dans l’article 4 de l’EUCD ». [EU Copyright Directive].

L’article 4 de la directive sur le droit d’auteur énonce une « exception ou limitation pour l’exploration de textes et de données » – spécifiquement pour « les reproductions et extractions d’œuvres et d’autres objets légalement accessibles à des fins d’exploration de textes et de données ».

Toutefois, dans son communiqué, l’Autorité affirme qu’il n’a pas encore été déterminé si l’exonération s’applique ici. (Il convient de noter que la clause pertinente fait référence aux « œuvres légalement accessibles » – alors que Google a un engagement juridiquement contraignant envers l’autorité de la concurrence d’informer les détenteurs de droits d’auteur de l’utilisation de leurs œuvres protégées et n’a apparemment pas réussi à le faire dans ce cas.)

« Quand il s’agit de déterminer si l’utilisation de contenus d’actualité pour former un service d’intelligence artificielle relève des droits voisins et de la protection, cette question n’a pas encore reçu de réponse », a écrit l’autorité de la concurrence. « Toutefois, l’Autorité considère que Google a violé son engagement n°1 en omettant d’informer les éditeurs que leurs contenus avaient été utilisés pour former Bard. »

Le billet de blog de Google mentionne également en passant la loi européenne sur l’IA, ce qui suggère qu’elle est pertinente. Cependant, la législation n’est pas encore en vigueur car elle attend son adoption définitive par le Conseil européen.

La nouvelle législation sur l’IA stipulera également que les développeurs doivent respecter les règles du bloc en matière de droits d’auteur. Et il introduit des exigences de transparence dans cet objectif – exigeant qu’ils mettent en place une politique visant à respecter la législation européenne sur le droit d’auteur ; et rendre public un « résumé suffisamment détaillé » du contenu utilisé pour la formation de modèles d’IA à usage général (tels que Gemini/Bard).

Cette nouvelle exigence imposée aux modélistes de publier un résumé des données de formation pourrait, à l’avenir, permettre aux éditeurs de nouvelles dont le contenu protégé a été ingéré pour la formation GenAI d’obtenir plus facilement une rémunération équitable en vertu de la loi européenne sur le droit d’auteur.

Pas de désabonnement technique

L’Autorité rappelle également que Google n’a pas fourni, jusqu’au 28 septembre 2023 au moins, une solution technique permettant aux éditeurs et aux agences de presse de s’opposer à ce que leurs contenus soient utilisés pour former Bard sans qu’une telle décision n’affecte l’affichage de leurs contenus sur d’autres services Google.

« Jusqu’à cette date, les éditeurs et les agences de presse qui souhaitaient se retirer de ce cas d’utilisation devaient insérer une instruction qui bloque toute indexation de contenu de Google, y compris pour les services Search, Discover et Google News. Ces services s’inscrivent spécifiquement dans la négociation des revenus liés aux droits voisins », écrit-il, ajoutant : « À l’avenir, l’Autorité examinera attentivement l’efficacité des processus d’opt-out de Google. »

En termes plus techniques, entre juillet et septembre 2023, les éditeurs de presse pourraient insérer une balise « noindex » dans le fichier robots.txt pour s’assurer que leur contenu n’était pas utilisé pour entraîner le modèle d’IA de Google. Ce fichier robots.txt est placé dans le dossier racine des serveurs Web et contient diverses instructions destinées aux moteurs de recherche. Le robot d’exploration de Google examine les instructions contenues dans ces fichiers pour indexer les sites Web.

Mais une balise « noindex » signifie que votre site Web disparaît complètement de Google. En septembre 2023, Google a ajouté plus de granularité et créé une règle « Google-Extended » différente de la règle « noindex ». En se désengageant des instructions Google-Extended, les éditeurs Web indiquent qu’ils ne souhaitent pas contribuer à l’amélioration des modèles actuels et futurs de Gemini.

Autres lacunes

L’Autorité sanctionne également Google pour une série d’autres problèmes liés à la manière dont il négocie avec les éditeurs d’information français, estimant qu’il ne leur a pas fourni toutes les informations nécessaires pour garantir une négociation équitable sur la rémunération de leurs contenus.

Dans son communiqué de presse, il écrit que les informations fournies par Google aux éditeurs sur sa méthodologie de calcul du montant qui leur est dû étaient « particulièrement opaques ».

L’étude a également révélé que Google ne satisfaisait pas aux critères de non-discrimination, visant à garantir l’égalité de traitement aux éditeurs. Et il a invoqué la décision de Google d’imposer un « seuil minimum » de rémunération, c’est-à-dire en dessous duquel il ne verserait aucune rémunération aux éditeurs, l’Autorité qualifiant cela d’introduction d’une discrimination entre éditeurs « dans son principe même ». En dessous d’un certain seuil, tous les éditeurs se voient « attribuer arbitrairement une rémunération nulle, quelle que soit leur situation respective », note également son communiqué.

Par ailleurs, l’Autorité a critiqué les calculs de Google concernant les revenus dits « indirects », estimant que le « paquet » proposé n’était pas conforme aux décisions antérieures ni à l’arrêt d’appel de la Cour de justice, d’octobre 2020.

Il a également déclaré que Google n’avait pas tenu son engagement de mettre à jour les contrats de rémunération conformément à ses engagements.

Source-146