Les modèles d’IA utilisant le travail d’individus sans autorisation (ou compensation) n’ont rien de nouveau, avec des entités comme Le New York Times et Getty Images engageant des poursuites contre les créateurs d’IA aux côtés d’artistes et d’écrivains. En mars, Mira Murati, CTO d’OpenAI, a contribué à l’incertitude persistante, en disant Le journal de Wall Street elle ne savait pas si Sora, le nouvel outil d’IA de synthèse texte-vidéo de l’entreprise, récupérait les données des publications YouTube, Instagram ou Facebook. Aujourd’hui, le PDG de YouTube, Neal Mohan, a répondu en avertissant clairement OpenAI que l’utilisation de ses vidéos pour enseigner Sora constituerait une « violation flagrante » des conditions d’utilisation de la plateforme.
Dans une interview avec Originaux Bloomberg l’animatrice Emily Chang, Mohan a déclaré : « Du point de vue d’un créateur, lorsqu’un créateur télécharge son travail acharné sur notre plateforme, il a certaines attentes. L’une de ces attentes est que les conditions de service soient respectées. Cela ne permet pas pour des choses comme des transcriptions ou des extraits vidéo à télécharger, et cela constitue une violation flagrante de nos conditions d’utilisation. Ce sont les règles de la route en termes de contenu sur notre plateforme.
Beaucoup d’incertitudes et de controverses entourent encore la manière dont OpenAI entraîne Sora, ainsi que ChatGPT et DALL-E, avec Le journal de Wall Street a récemment rapporté que la société prévoyait d’utiliser des transcriptions de vidéos YouTube pour former GPT-5. D’un autre côté, Google, concurrent d’OpenAI, respecte apparemment les règles, du moins en ce qui concerne YouTube (dont il est propriétaire). Le modèle d’IA de Google, Gemini, nécessite des données similaires pour apprendre, mais Mohan affirme qu’il n’utilise que certaines vidéos, en fonction des autorisations accordées dans le contrat de licence de chaque créateur.