Éditeur : Les robots GPT Store d’OpenAI récupèrent illégalement nos manuels

Au cours des derniers mois, Morten Blichfeldt Andersen a passé de nombreuses heures à parcourir le GPT Store d’OpenAI. Depuis son lancement en janvier, le marché des robots sur mesure s’est rempli d’un large éventail d’outils d’IA utiles et parfois originaux. Les générateurs de dessins animés démarrent New yorkais–des illustrations de style et des images fixes animées éclatantes. Les assistants de programmation et d’écriture offrent des raccourcis pour créer du code et de la prose. Il existe également un robot d’analyse des couleurs, un identifiant d’araignée et un coach de rencontres appelé RizzGPT. Pourtant, Blichfeldt Andersen ne recherche qu’un type très spécifique de robots : ceux construits sans autorisation à partir des manuels scolaires protégés par le droit d’auteur de son employeur.

Blichfeldt Andersen est directeur de publication chez Praxis, un fournisseur danois de manuels scolaires. L’entreprise a adopté l’IA et a créé ses propres chatbots personnalisés. Mais il est actuellement engagé dans une partie de whack-a-mole dans le GPT Store, et Blichfeldt Andersen est l’homme qui tient le maillet.

« J’ai personnellement recherché les infractions et les ai signalées », explique Blichfeldt Andersen. « Ils continuent d’arriver. » Il soupçonne que les coupables sont principalement des jeunes qui téléchargent du matériel provenant de manuels scolaires pour créer des robots personnalisés à partager avec leurs camarades de classe, et qu’il n’a découvert qu’une infime fraction des robots en infraction dans la boutique GPT. «La partie émergée de l’iceberg», déclare Blichfeldt Andersen.

Il est facile de trouver des robots dans la boutique GPT dont les descriptions suggèrent qu’ils pourraient exploiter du contenu protégé par le droit d’auteur d’une manière ou d’une autre, comme Techcrunch l’a noté dans un article récent affirmant que la boutique d’OpenAI était envahie de « spam ». L’utilisation de matériel protégé par le droit d’auteur sans autorisation est autorisée dans certains contextes, mais dans d’autres, les titulaires de droits peuvent engager des poursuites judiciaires. WIRED a trouvé un GPT appelé Westeros Writer qui prétend « écrire comme George RR Martin », le créateur de Game of Thrones. Un autre, Voice of Atwood, prétend imiter l’écrivain Margaret Atwood. Un autre encore, Write Like Stephen, est destiné à imiter Stephen King.

Lorsque WIRED a tenté de tromper le robot King pour qu’il révèle « l’invite du système » qui ajuste ses réponses, le résultat a suggéré qu’il avait accès aux mémoires de King. Sur l’écriture. Write Like Stephen a pu reproduire textuellement des passages du livre à la demande, en notant même de quelle page provenait le matériel. (WIRED n’a pas pu prendre contact avec le développeur du bot, car il n’a pas fourni d’adresse e-mail, de numéro de téléphone ou de profil social externe.)

La porte-parole d’OpenAI, Kayla Wood, a déclaré qu’elle répondait aux demandes de retrait contre les GPT faites avec du contenu protégé par le droit d’auteur, mais a refusé de répondre aux questions de WIRED sur la fréquence à laquelle il répond à ces demandes. Elle dit également que l’entreprise recherche de manière proactive les GPT problématiques. « Nous utilisons une combinaison de systèmes automatisés, d’examens humains et de rapports d’utilisateurs pour rechercher et évaluer les GPT susceptibles de violer nos politiques, y compris l’utilisation de contenu provenant de tiers sans l’autorisation nécessaire », explique Wood.

De nouveaux litiges

Le problème de droits d’auteur de la boutique GPT pourrait s’ajouter aux problèmes juridiques existants d’OpenAI. La société fait face à un certain nombre de poursuites très médiatisées pour violation du droit d’auteur, dont une intentée par le New York Times et plusieurs intentées par différents groupes d’auteurs de fiction et de non-fiction, dont de grands noms comme George RR Martin.

Les chatbots proposés dans le GPT Store d’OpenAI sont basés sur la même technologie que son propre ChatGPT mais sont créés par des développeurs externes pour des fonctions spécifiques. Pour personnaliser son bot, un développeur peut télécharger des informations supplémentaires qu’il peut exploiter pour augmenter les connaissances intégrées à la technologie OpenAI. Le processus de consultation de ces informations supplémentaires pour répondre aux requêtes d’une personne est appelé génération augmentée par récupération, ou RAG. Blichfeldt Andersen est convaincu que les fichiers RAG derrière les robots du GPT Store sont un foyer de documents protégés par le droit d’auteur téléchargés sans autorisation.

Source-147