Quand la nouvelle est tombée L’année dernière, lorsque le poids lourd de l’IA OpenAI et Axel Springer avaient conclu un accord financier et un partenariat, cela semblait de bon augure pour l’harmonie entre les gens qui écrivent des mots et les entreprises technologiques qui les utilisent pour aider à créer et former des modèles d’intelligence artificielle. À l’époque, OpenAI était également parvenu à un accord avec l’AP, à titre de référence.
Puis, à la fin de l’année, le New York Times a poursuivi OpenAI et son sponsor Microsoft, alléguant que les modèles d’IA générative de la société d’IA avaient été « construits en copiant et en utilisant des millions d’articles de presse protégés par le droit d’auteur du Times, des enquêtes approfondies, des articles d’opinion, des critiques, comment -aux guides, et plus encore. En raison de ce que le Times considère comme « une utilisation illégale de [its] travaillent à créer des produits d’intelligence artificielle », OpenAI « peut générer un résultat qui récite textuellement le contenu du Times, le résume fidèlement et imite son style expressif, comme le démontrent de nombreux exemples. »
L’Exchange explore les startups, les marchés et l’argent.
Lisez-le tous les matins sur TechCrunch+ ou recevez la newsletter The Exchange tous les samedis.
Le Times a ajouté dans sa plainte qu’il « s’est opposé après avoir découvert que les accusés utilisaient le contenu du Times sans autorisation pour développer leurs modèles et outils » et que « les négociations n’ont pas abouti à une résolution » avec OpenAI.
Comment équilibrer la nécessité de respecter le droit d’auteur et garantir que le développement de l’IA ne s’arrête pas ne sera pas résolu rapidement. Mais les accords et les différends plus conflictuels entre les créateurs et les sociétés d’IA qui souhaitent ingérer et utiliser ce travail pour construire des modèles d’intelligence artificielle créent un moment malheureux pour les deux parties au conflit. Les entreprises technologiques sont en train de créer de nouveaux modèles d’IA générative formés sur des données incluant du matériel protégé par le droit d’auteur dans leurs produits logiciels ; Microsoft est un leader dans ce domaine particulier, il convient de le noter. Et les sociétés de médias qui ont dépensé énormément au fil du temps pour constituer un corpus de documents rapportés et créés d’une autre manière sont furieuses que leurs efforts soient absorbés par des machines qui ne rendent rien en retour aux personnes qui ont fourni leurs données de formation.