Une législation européenne signalée visant à divulguer les données de formation à l’IA pourrait déclencher des poursuites en matière de droit d’auteur

Le boom actuel de l’IA, de Bing et Midjourney, repose sur l’accès gratuit aux données de formation, dont une grande partie est récupérée sur le Web et souvent protégée par le droit d’auteur. L’utilisation de ces données a suscité à la fois des critiques et des poursuites, notamment dans le monde de l’art, les titulaires de droits arguant que leur travail est exploité sans leur autorisation.

Certains des plus grands acteurs du monde de l’IA, comme OpenAI, ont évité tout examen en refusant simplement de détailler les données utilisées pour créer leur logiciel. Mais la législation proposée dans l’UE pour réglementer l’IA (loi sur l’IA, longue et ambitieuse) pourrait obliger les entreprises à divulguer ces informations, selon rapports de Reuter et Euractiv.

L’amendement aurait été un ajout tardif au projet de loi sur l’IA

Reuter indique que les amendements tardifs à la loi sur l’IA, qui ont été approuvés sous forme de projet par les législateurs plus tôt cette semaine, obligeront « les entreprises déployant des outils Al génératifs, tels que ChatGPT… à divulguer tout matériel protégé par le droit d’auteur utilisé pour développer leurs systèmes ». Plus tôt ce mois-ci, Euractiv a fait état de la même disposition, affirmant que les entreprises devraient « rendre publiquement disponible un résumé divulguant l’utilisation des données de formation protégées par la loi sur le droit d’auteur ». Reuters, citant « des sources proches des discussions », dit que l’amendement était « un ajout tardif rédigé au cours des deux dernières semaines ».

Les détails de cette exigence sont inconnus et la loi pourrait changer au cours des prochaines négociations à huis clos, appelées trilogues, nécessaires pour finaliser l’acte. Mais si les entreprises d’IA sont obligées de divulguer les sources de leurs données de formation, cela pourrait ouvrir la porte à de nombreuses poursuites judiciaires qui affecteraient certains des plus grands noms de la technologie.

Déjà, des entreprises comme Getty Images poursuivent l’IA génératrice d’images pour avoir récupéré leurs données sans autorisation, alors qu’il existe un petit nombre de recours collectifs ciblant l’IA génératrice d’images et de codes. Cependant, le plus grand nom de l’IA aujourd’hui – OpenAI, créateur de ChatGPT, GPT-4 et DALL-E et la puissance derrière la poussée de l’IA de Microsoft – est extrêmement secret sur ses sources de données. La législation signalée pourrait changer cela, en fournissant des preuves de poursuites judiciaires et en influençant les discussions entre des organisations telles que les entreprises de médias, dont les données sont utilisées et référencées par de nombreux chatbots.

Bien que l’impact potentiel de la loi dépende de ses détails, le reste de la loi sur l’IA de l’UE aura certainement des effets tout aussi larges sur le paysage de l’IA en évolution rapide.

La loi classera les systèmes d’IA en fonction de leur risque perçu et obligera les entreprises chargées de créer les outils les plus percutants à divulguer des données importantes sur la sécurité, l’interprétabilité, les performances, etc. Comme pour la précédente réglementation technologique imposée par l’UE, la loi sur l’IA aura sans aucun doute un effet mondial sur la façon dont les entreprises technologiques font des affaires. Les législateurs de l’UE continueront de discuter des détails de la loi tout au long de l’année, bien que la conformité pour les entreprises n’entre probablement pas en vigueur avant 2025 ou plus tard.

source site-132