Les créateurs exhortent Ottawa à forcer la divulgation de la formation du système d’IA « boîte noire »

Contenu de l’article

OTTAWA — Les créateurs et éditeurs canadiens veulent que le gouvernement fasse quelque chose contre l’utilisation non autorisée et généralement non déclarée de leur contenu pour former des systèmes d’intelligence artificielle générative.

Publicité 2

Contenu de l’article

Mais les entreprises d’IA soutiennent que l’utilisation de ce matériel pour entraîner leurs systèmes ne viole pas le droit d’auteur, et affirment que limiter son utilisation entraverait le développement de l’IA au Canada.

Les deux parties présentent leurs arguments dans des mémoires récemment publiés dans le cadre d’une consultation sur le droit d’auteur et l’IA menée par le gouvernement fédéral alors qu’il examine la manière dont les lois canadiennes sur le droit d’auteur devraient aborder l’émergence de systèmes d’IA génératifs comme ChatGPT d’OpenAI.

L’IA générative peut créer du texte, des images, des vidéos et du code informatique à partir d’une simple invite, mais pour ce faire, les systèmes doivent d’abord étudier de vastes quantités de contenu existant.

Dans son mémoire au gouvernement, Access Copyright a soutenu que la plupart, et potentiellement tous les grands modèles linguistiques « profitent actuellement de l’utilisation et de la reproduction non autorisées d’œuvres protégées par le droit d’auteur ».

Contenu de l’article

Annonce 3

Contenu de l’article

Cela se déroule dans une « boîte noire », selon Access Copyright, qui représente les écrivains, les artistes visuels et les éditeurs.

« Les titulaires de droits savent que cela se produit, mais en raison de l’asymétrie d’information entre eux et les plateformes d’IA, ils ne peuvent pas déterminer qui mène l’activité, avec les œuvres de qui, et ne disposent d’aucun mécanisme pour l’empêcher de se produire. »

Music Canada, qui représente les principales maisons de disques du pays, a déclaré l’année dernière qu’une fausse chanson générée par l’IA imitant les voix de Drake et de The Weeknd « a montré une chose très claire : les modèles et systèmes d’IA ont déjà ingéré des quantités massives d’ensembles de données propriétaires sans l’autorisation de la source des données ou des titulaires de droits ».

La Writers’ Guild of Canada a demandé au gouvernement de commencer à mettre en place des obligations de base en matière de divulgation et de rapport. Selon elle, les développeurs ont toute connaissance des œuvres exploitées et de la manière dont elles sont utilisées, alors que les créateurs n’ont aucune de ces informations.

Publicité 4

Contenu de l’article

Certaines organisations ont signé des accords de licence avec des entreprises spécialisées dans l’IA. Mais l’Association canadienne des auteurs a déclaré que les titulaires de droits se heurtaient à « d’énormes obstacles » pour obtenir des licences sur leur contenu « parce qu’ils ne savent pas quelles œuvres sont utilisées » par quelles entreprises.

VIDÉO RECOMMANDÉE

Chargement...

Nous nous excusons, mais cette vidéo n’a pas pu se charger.

Elle a demandé au Canada de préciser que l’exploration de textes et de données est soumise aux lois sur le droit d’auteur.

De nombreuses poursuites sont en cours aux États-Unis concernant l’utilisation de matériels protégés par le droit d’auteur par des systèmes d’IA générative, dont une lancée cette semaine par les plus grandes maisons de disques du monde contre deux générateurs de musique IA.

L’Association canadienne des producteurs de médias a déclaré que les affaires judiciaires illustrent le problème posé par le manque de transparence, citant un cas dans lequel la société d’IA a fait valoir que le titulaire des droits ne pouvait pas donner suite à l’allégation de violation à moins de pouvoir spécifier l’œuvre exacte utilisée pour la formation.

Publicité 5

Contenu de l’article

« Les titulaires de droits seront sans aucun doute également confrontés à des problèmes de preuve similaires, car de nombreux ensembles de données utilisés pour former les systèmes d’IA générative sont prétendument détruits une fois la formation initiale terminée », a-t-il déclaré.

Le groupe a déclaré qu’il s’agissait d’une question qui « exige une attention immédiate » et a demandé au gouvernement de mettre en œuvre des exigences de transparence.

Mais les sociétés d’IA maintiennent que le type de transparence réclamé par les titulaires de droits n’est pas réaliste.

Microsoft a déclaré au gouvernement que la formation de systèmes d’IA à grande échelle impliquait de « vastes volumes » de données, et que les entreprises ne devraient pas avoir à conserver de traces de ces données ni à divulguer le contenu utilisé pour la formation.

« Il ne serait pas possible d’enregistrer de telles informations et une telle exigence freinerait le développement de l’IA », a-t-il déclaré.

Publicité 6

Contenu de l’article

L’entreprise a fait valoir que le fait d’analyser des œuvres et d’apprendre des concepts et des faits ne constituait pas une « violation du droit d’auteur ».

Google a déclaré que la formation de l’IA est déjà exemptée en vertu de la loi actuelle sur le droit d’auteur, bien que le gouvernement devrait adopter une exemption pour rendre cela explicite.

Google a déclaré qu’exiger l’autorisation d’utiliser du contenu à des fins de formation exposerait des informations sensibles sur le plan concurrentiel et « bloquerait efficacement le développement et l’utilisation de grands modèles de langage et d’autres types d’IA de pointe ».

Il a également déclaré que les développeurs d’IA n’ont pas accès à des informations précises sur le statut des droits d’auteur.

« En fait, il n’existe aucune source de vérité de ce type dans le monde. Il peut donc s’avérer tout simplement impossible de se conformer aux règles de divulgation dès le départ. »

Annonce 7

Contenu de l’article

La société canadienne d’IA Cohere a déclaré que l’utilisation de contenu pour former des systèmes d’IA fonctionne de la même manière que la façon dont un individu lit des livres pour devenir plus informé.

L’entreprise a déclaré que le processus ne violait pas le droit d’auteur et a fait valoir que cela devait être clairement stipulé dans la loi. Sinon, « les ambitions du Canada de devenir le foyer d’entreprises et d’écosystèmes d’IA de premier plan » pourraient être compromises.

Le Conseil canadien des innovateurs, qui représente le secteur technologique canadien, a déclaré que les exigences de divulgation nuiraient aux petites entreprises, par opposition à leurs rivales des grandes entreprises technologiques. Il a prévenu que cela « entraverait sérieusement le potentiel des entreprises canadiennes à se développer de manière significative ».

Contenu de l’article

Source link-19