Udio et Suno ne sont pas, malgré leurs noms, les nouveaux restaurants les plus en vogue du Lower East Side. Ce sont des startups d’IA qui permettent aux gens de générer des chansons au son incroyablement réel, avec des instruments et des performances vocales, à partir d’invites. Et lundi, un groupe de grandes maisons de disques les a poursuivis en justice, alléguant une violation du droit d’auteur « à une échelle presque inimaginable », affirmant que les sociétés ne peuvent le faire que parce qu’elles ont ingéré illégalement d’énormes quantités de musique protégée par le droit d’auteur pour entraîner leurs modèles d’IA.
Ces deux procès contribuent à accroître les problèmes juridiques auxquels est confrontée l’industrie de l’IA. Certaines des entreprises les plus performantes du secteur ont formé leurs modèles avec des données acquises via l’IA. grattage non autorisé d’énormes quantités d’informations provenant d’Internet. ChatGPT, par exemple, a été initialement formé sur des millions de documents collectés à partir de liens postés sur Reddit.
Ces poursuites, menées par la Recording Industry Association of America (RIAA), s’attaquent à la musique plutôt qu’à l’écrit. Mais comme Le New York Times‘ contre OpenAI, ils posent une question qui pourrait remodeler le paysage technologique tel que nous le connaissons : les entreprises d’IA peuvent-elles simplement prendre ce qu’elles veulent, le transformer en un produit valant des milliards et prétendre qu’il s’agit d’un usage équitable ?
« C’est la question clé qui doit être réglée, car elle touche à toutes sortes d’industries différentes », a déclaré Paul Faklerassocié du cabinet d’avocats Mayer Brown, spécialisé dans les affaires de propriété intellectuelle.
Que sont Udio et Suno ?
Udio et Suno sont tous deux relativement nouveaux, mais ils ont déjà fait sensation. Suno a été lancé en décembre par une équipe basée à Cambridge qui travaillait auparavant pour Kensho, une autre société d’IA. Elle a rapidement conclu un partenariat avec Microsoft qui a intégré Suno à Copilot, le chatbot IA de Microsoft.
Udio a été lancé cette année, récolter des millions de dollars des poids lourds du monde de l’investissement technologique (Andreessen Horowitz) et du monde de la musique (Will.i.am et Common, par exemple). La plate-forme d’Udio a été utilisée par le comédien King Willonius pour générer « BBL Drizzy », le morceau dissident de Drake qui est devenu viral après que le producteur Metro Boomin l’a remixé et l’a rendu public pour que tout le monde puisse le rapper.
Pourquoi l’industrie musicale poursuit-elle Udio et Suno ?
Les poursuites intentées par la RIAA utilisent un langage noble, affirmant que ce litige vise à « garantir que le droit d’auteur continue d’encourager l’invention et l’imagination humaines, comme c’est le cas depuis des siècles ». Cela semble bien, mais en fin de compte, l’incitation dont il est question est l’argent.
La RIAA affirme que l’IA générative présente un risque pour le modèle économique des maisons de disques. « Plutôt que de concéder sous licence des enregistrements sonores protégés par le droit d’auteur, les titulaires de licence potentiels intéressés par une licence pour de tels enregistrements pour leurs propres besoins pourraient générer un son similaire à l’IA pratiquement sans frais », indiquent les poursuites, ajoutant que de tels services pourraient « [flood] le marché avec des « copieurs » et des « soundalikes », bouleversant ainsi une activité de licence d’échantillons établie.
La RIAA demande également des dommages-intérêts de 150 000 dollars par œuvre contrefaite, ce qui, compte tenu des corpus massifs de données généralement utilisées pour entraîner les systèmes d’IA, constitue un chiffre potentiellement astronomique.
Est-il important que les chansons générées par l’IA soient similaires aux vraies ?
Les poursuites de la RIAA comprenaient des exemples de musique générée avec Suno et Udio et des comparaisons de leur notation musicale avec des œuvres protégées par le droit d’auteur existantes. Dans certains cas, les chansons générées comportaient de petites phrases similaires – par exemple, l’une d’elles commençait par la ligne chantée « Jason Derulo » à la cadence exacte avec laquelle le vrai Jason Derulo commence plusieurs de ses chansons. D’autres avaient des séquences étendues de notation similaire, comme dans le cas d’un morceau inspiré de « American Idiot » de Green Day.
Un morceau a commencé par la ligne chantée « Jason Derulo » à la cadence exacte avec laquelle le vrai Jason Derulo commence plusieurs de ses chansons.
Ce semble assez accablant, mais la RIAA ne prétend pas que ces pistes sonores spécifiques enfreignent le droit d’auteur – elle prétend plutôt que les sociétés d’IA ont utilisé de la musique protégée par le droit d’auteur dans le cadre de leurs données de formation.
Ni Suno ni Udio n’ont rendu publics leurs ensembles de données de formation. Et les deux entreprises restent vagues sur les sources de leurs données de formation – bien que cela soit normal dans le secteur de l’IA. (OpenAI, par exemple, a questions esquivées si des vidéos YouTube ont été utilisées pour entraîner son modèle vidéo Sora.)
Les poursuites de la RIAA notent que le PDG d’Udio, David Ding, a déclaré que la société s’entraînait sur la musique de « meilleure qualité » qui est « accessible au public » et qu’un co-fondateur de Suno a écrit dans le Discord officiel de Suno que la société s’entraînait avec un « mélange de musique exclusive et données publiques. »
Fakler a déclaré que l’inclusion d’exemples et de comparaisons de notations dans le procès était « farfelue », affirmant que cela allait « bien au-delà » de ce qui serait nécessaire pour invoquer des motifs légitimes pour un procès. D’une part, les labels ne détiennent peut-être pas les droits de composition des chansons qui auraient été ingérées par Udio et Suno à des fins de formation. Au contraire, ils détiennent les droits d’auteur sur l’enregistrement sonore, donc montrer une similitude dans la notation musicale n’aide pas nécessairement dans un litige sur les droits d’auteur. « Je pense qu’il est vraiment conçu pour l’optique à des fins de relations publiques », a déclaré Fakler.
En plus de cela, a noté Fakler, il est légal de créer un enregistrement audio similaire si vous disposez des droits sur la chanson sous-jacente.
Lorsqu’il a été contacté pour commenter, un porte-parole de Suno a partagé une déclaration du PDG Mikey Shulman déclarant que sa technologie est « transformatrice » et que la société n’autorise pas les invites nommant des artistes existants. Udio n’a pas répondu à une demande de commentaire.
Est-ce un usage équitable ?
Mais même si Udio et Suno utilisaient les œuvres protégées par le droit d’auteur des maisons de disques pour former leurs modèles, il reste une très grande question qui pourrait primer sur tout le reste : est-ce un usage équitable ?
L’utilisation équitable est une défense juridique qui permet l’utilisation de matériel protégé par le droit d’auteur dans la création d’une œuvre significativement nouvelle ou transformatrice. La RIAA affirme que les startups ne peuvent pas revendiquer un usage équitable, affirmant que les sorties d’Udio et Suno sont destinées à remplacer de vrais enregistrements, qu’elles sont générées dans un but commercial, que la copie était extensive plutôt que sélective et, enfin, que le résultat Ce produit constitue une menace directe pour l’activité des labels.
De l’avis de Fakler, les startups disposent d’un solide argument d’utilisation équitable tant que les œuvres protégées par le droit d’auteur n’ont été copiées que temporairement et que leurs caractéristiques déterminantes ont été extraites et résumées dans les poids d’un modèle d’IA.
« Il s’agit d’extraire toutes ces choses, tout comme un musicien apprendrait ces choses en jouant de la musique. »
« C’est ainsi que fonctionnent les ordinateurs : ils doivent faire ces copies, et l’ordinateur analyse ensuite toutes ces données afin de pouvoir extraire les éléments non protégés par le droit d’auteur », a-t-il déclaré. « Comment pouvons-nous construire des chansons qui seront comprises comme de la musique par un auditeur et qui présentent diverses caractéristiques que l’on retrouve couramment dans la musique populaire ? Il s’agit d’extraire tout cela, tout comme un musicien apprendrait ces choses en jouant de la musique.
« À mon avis, il s’agit d’un argument très solide en matière d’utilisation équitable », a déclaré Fakler.
Bien entendu, un juge ou un jury peut ne pas être d’accord. Et ce qui est ressorti du processus d’enquête préalable – si ces poursuites devaient aboutir – pourrait avoir un effet important sur l’affaire. Les morceaux de musique qui ont été pris et la manière dont ils se sont retrouvés dans l’ensemble de formation pourraient avoir de l’importance, et les détails du programme de formation pourraient saper une défense d’utilisation équitable.
Nous sommes tous partis pour un très long voyage alors que les poursuites de la RIAA, et d’autres similaires, se dérouleront devant les tribunaux. Des textes et photos jusqu’aux désormais enregistrements sonores, la question du fair use plane sur tous ces cas et sur l’industrie de l’IA dans son ensemble.