Getty Images a entamé des poursuites judiciaires contre le créateur de l’outil d’art IA Stable Diffusion. Déposée cette semaine devant la Haute Cour de Londres, l’action de Getty Images affirme que « Stability AI a copié et traité illégalement des millions d’images protégées par le droit d’auteur » et a utilisé ces images à son propre profit commercial.
Getty Images et les détenteurs de droits de bibliothèque d’images comme celui-ci devraient être parmi les plus touchés par la génération d’images IA, et bien que certains aient adopté la technologie, comme Shutterstock (s’ouvre dans un nouvel onglet), d’autres ont largement rejeté l’art de l’IA. Getty Images appartient à cette dernière catégorie. Getty Images a interdit le téléchargement et la vente d’images AI (s’ouvre dans un nouvel onglet) en septembre 2022, dans le but de se protéger des contestations judiciaires.
Le PDG de Getty, Craig Peters, avait précédemment déclaré que les œuvres d’art créées par l’IA suscitaient des inquiétudes, notamment des « problèmes de droits non résolus ».
Nous ne savions pas à l’époque que les contestations judiciaires viendraient directement de Getty lui-même.
« Getty Images pense que l’intelligence artificielle a le potentiel de stimuler les efforts créatifs », a déclaré Getty Images. (s’ouvre dans un nouvel onglet) dit. « En conséquence, Getty Images a fourni des licences à des innovateurs technologiques de premier plan à des fins liées à la formation de systèmes d’intelligence artificielle d’une manière qui respecte les droits de propriété personnelle et intellectuelle. »
« Stability AI n’a pas demandé une telle licence à Getty Images et a plutôt, selon nous, choisi d’ignorer les options de licence viables et les protections juridiques de longue date dans la poursuite de leurs intérêts commerciaux autonomes. »
Tout se résume à la façon dont une IA est formée – l’étape préliminaire la plus importante pour créer un outil d’intelligence artificielle fonctionnel.
L’art généré par Stable Diffusion, et les autres outils similaires, est original. Il n’y a probablement rien d’autre exactement comme ça – une IA l’a créé en fonction des invites qui lui sont transmises par ses utilisateurs humains. Cependant, l’IA doit être formée sur des millions d’images étiquetées afin d’apprendre quoi créer, et ce que cela signifie car le droit d’auteur des images utilisées pour cette formation a été remis en question à de nombreuses reprises.
Ces grands ensembles de données de paires d’images et de textes sont souvent fournis par d’autres sociétés qui collectent et rassemblent les données elles-mêmes. Ce sont des ensembles de données massifs, nous parlons de millions ou de milliards d’entrées pour chacun. Cela signifie que collecter suffisamment d’échantillons pour remplir un ensemble de données complet peut être un travail exhaustif et nécessite d’immenses quantités de matériel source créé par l’homme – et chacune de ces images a son propre droit d’auteur, du domaine public au droit d’auteur strict ou aux conditions d’utilisation.
L’une de ces organisations d’ensembles de données est LAION (s’ouvre dans un nouvel onglet)qui fournit les ensembles de données utilisés pour la diffusion stable.
LAION est à but non lucratif et distribue librement ses jeux de données. Il rassemble essentiellement des ensembles de données à partir de texte alternatif et d’URL d’images qu’il gratte à partir d’Internet. Il ne possède rien. L’organisation essaie de faire la paix avec cela dans la première question de sa FAQ (s’ouvre dans un nouvel onglet): « Est-ce que les jeux de données LAION respectent les lois sur le droit d’auteur ? »
A quoi l’organisation répond : « Les ensembles de données du LAION sont simplement des index sur Internet. »
Vous pourriez même trouver une photo de vous dans les ensembles de données de LAION, pour lesquels l’organisation a fourni un formulaire de retrait GDPR pour rester en conformité avec la législation de l’UE.
LAION essaie de garder ses mains propres en ne stockant ni en distribuant directement aucune image, et cela a peut-être fonctionné car la colère de Getty Images vise plutôt Stability AI, l’une des sociétés les plus connues utilisant ses ensembles de données.
Stability AI soutient que les ensembles de données LAION qu’il utilise pour la diffusion stable ont été formés conformément à la loi allemande. En réponse à sa propre question FAQ « Quel est le droit d’auteur pour l’utilisation des images générées par Stable Diffusion? » Stability AI déclare que « le domaine des images générées par l’IA et du droit d’auteur est complexe et variera d’une juridiction à l’autre ».
Une réponse vraiment ambiguë.
L’IA de stabilité indique au moins d’où elle tire ses données – LAION est en fait l’une des organisations de grattage d’images les plus ouvertes sur le Web – contrairement à certains outils d’IA qui ne rendent pas ces informations accessibles au public. Cela inclut OpenAI (s’ouvre dans un nouvel onglet), le créateur d’outils d’IA populaires tels que DALL-E et ChatGPT. Stability AI prévoit de permettre aux artistes de se retirer de la formation d’image Stable Diffusion (s’ouvre dans un nouvel onglet) avec les futures versions, mais cela semble un peu comme le mauvais chemin. Stable Diffusion ne devrait-il pas demander l’autorisation des artistes pour utiliser leur travail ?
Il n’y a pas de réponse à l’action en justice de Stability AI pour le moment, mais j’ai contacté la société pour obtenir des commentaires.
Le PDG de Getty Images s’est entretenu avec The Verge (s’ouvre dans un nouvel onglet) pour expliquer plus en détail pourquoi l’entreprise a pris cette décision.
« Nous ne pensons pas que ce déploiement spécifique de l’offre commerciale de Stability soit couvert par une utilisation équitable au Royaume-Uni ou une utilisation équitable aux États-Unis », a déclaré Peters. « La société n’a fait aucune démarche auprès de Getty Images pour utiliser notre matériel ou celui de nos contributeurs, nous prenons donc des mesures pour protéger nos droits de propriété intellectuelle et ceux de nos contributeurs. »
Peters a également confirmé que les accusations portées contre Stability AI incluent la violation du droit d’auteur et la violation des conditions d’utilisation de Getty Images. Il a déclaré que la société cherchait à former un nouveau statu quo juridique pour les licences et l’IA à partir de l’affaire judiciaire.
Un tel statu quo pourrait être formateur pour l’industrie naissante des outils d’IA générative. La loi sur le droit d’auteur n’a pas encore rattrapé la formation de l’IA sur des ensembles de données massifs d’images grattées, ce qui signifie que ces prochaines années d’action en justice pourraient façonner notre approche de ce sujet pour les décennies à venir.
Le procès intenté par Getty Images est susceptible de créer un précédent juridique, quelle qu’en soit l’issue.
Cela devait arriver à un moment donné, et les arguments sur le droit d’auteur entourant à la fois les images générées par l’IA et la formation des outils d’IA ne font que commencer.