Des entreprises d’intelligence artificielle comme OpenAI et Google s’appuient sur le contenu protégé des éditeurs pour former leurs modèles de langage, selon une étude de Ziff Davis. Bien qu’elles privilégient les contenus de qualité pour optimiser leurs systèmes, le manque de transparence suscite des inquiétudes parmi les consommateurs et les éditeurs, qui dénoncent l’utilisation non autorisée de leur travail. Malgré quelques accords de licence, de nombreux éditeurs font face à des défis majeurs dans un paysage médiatique concurrentiel.
Les Grandes Entreprises d’IA et le Contenu des Éditeurs Premium
Des géants de l’intelligence artificielle tels qu’OpenAI, Google, Meta et Anthropic s’appuient largement sur le contenu de publishers de renom pour entraîner leurs modèles de langage avancés, souvent appelés LLM. Une étude récente menée par Ziff Davis, une entreprise d’édition en ligne, met en lumière les pratiques de ces sociétés, qui semblent minimiser leur dépendance vis-à-vis de ce contenu protégé par des droits d’auteur.
L’Importance du Contenu de Qualité pour l’Entraînement des Modèles
D’après le rapport rédigé par George Wukoson, avocat en intelligence artificielle chez Ziff Davis, et le directeur technique Joey Fortuna, les entreprises d’IA tendent à privilégier les contenus de qualité, soigneusement sélectionnés, pour concevoir leurs modèles. Cela s’explique par le désir d’optimiser les performances de leurs systèmes. Les sources d’information sont souvent évaluées en fonction de leur autorité de domaine, qui est corrélée à leur position dans les résultats de recherche, ce qui garantit une fiabilité accrue des données d’entraînement.
Cependant, ce manque de transparence sur les sources d’information pose problème aux consommateurs, qui ne peuvent pas évaluer la véracité ou l’éventuel biais des données utilisées. De plus, cela soulève des préoccupations auprès des éditeurs, qui accusent ces entreprises d’utiliser leur contenu sans autorisation ni compensation. Bien qu’OpenAI ait commencé à conclure des accords de licence avec certains éditeurs, d’autres, comme le New York Times, ont engagé des poursuites pour des violations de droits d’auteur.
Alors que les valorisations des entreprises technologiques continuent d’augmenter grâce à l’IA, le secteur de l’édition fait face à des défis considérables, avec des vagues de licenciements et une concurrence féroce dans le paysage médiatique. Les accords de licence signés par certaines entreprises d’IA avec des éditeurs montrent qu’il existe des efforts pour établir une relation plus équilibrée, mais la majorité des entreprises d’IA, comme Ziff Davis, n’ont pas encore trouvé d’accord semblable.