dimanche, décembre 22, 2024

Le plan d’une start-up pour résoudre le problème du « vol à l’étalage » de l’IA

Bloomberg via Getty

Bill Gross s’est fait un nom dans le monde de la technologie dans les années 1990, lorsqu’il a inventé un nouveau moyen pour les moteurs de recherche de gagner de l’argent grâce à la publicité. Selon son système de tarification, les annonceurs payaient lorsque les gens cliquaient sur leurs annonces. Aujourd’hui, le spécialiste du « paiement au clic » a fondé une start-up appelée ProRata, qui a un modèle commercial audacieux, peut-être utopique : le « paiement à l’utilisation de l’IA ».

Gross, PDG de l’entreprise de Pasadena, en Californie, ne mâche pas ses mots à propos de l’industrie de l’IA générative. « C’est du vol », dit-il. « Ils volent à l’étalage et blanchissent les connaissances du monde à leur profit. »

Les entreprises d’IA affirment souvent qu’elles ont besoin de vastes quantités de données pour créer des outils génératifs de pointe et que l’extraction de données sur Internet, qu’il s’agisse de textes provenant de sites Web, de vidéos ou de sous-titres provenant de YouTube, ou de livres volés dans des bibliothèques pirates, est légalement autorisée. Gross ne croit pas à cet argument. « Je pense que c’est du pipeau », dit-il.

Il en va de même pour de nombreux dirigeants de médias, artistes, écrivains, musiciens et autres détenteurs de droits qui s’y opposent : il est difficile de suivre le flot constant de poursuites en matière de droits d’auteur déposées contre les entreprises d’IA, alléguant que leur mode de fonctionnement équivaut à un vol.

Mais Gross pense que ProRata offre une solution qui évite les batailles juridiques. « Rendre le système équitable, c’est ce que j’essaie de faire », dit-il. « Je ne pense pas que ce problème doive être résolu par des poursuites judiciaires. »

Son entreprise a pour objectif de mettre en place des accords de partage des revenus afin que les éditeurs et les particuliers soient rémunérés lorsque des entreprises d’IA utilisent leur travail. Gross l’explique ainsi : « Nous pouvons prendre le résultat de l’IA générative, qu’il s’agisse de texte, d’image, de musique ou d’un film, et le décomposer en composants, pour déterminer d’où ils viennent, puis attribuer un pourcentage d’attribution à chaque titulaire de droits d’auteur, puis les payer en conséquence. » ProRata a déposé des demandes de brevet pour les algorithmes qu’elle a créés pour attribuer l’attribution et effectuer les paiements appropriés.

Cette semaine, la société, qui a levé 25 millions de dollars, a été lancée avec un certain nombre de partenaires de renom, dont Universal Music Group, le Financial Times, The Atlantic et la société de médias Axel Springer. En outre, elle a conclu des accords avec des auteurs très suivis, notamment Tony Robbins, Neal Postman et Scott Galloway. (Elle s’est également associée à l’ancien directeur de la communication de la Maison Blanche, Anthony Scaramucci.)

Même le professeur de journalisme Jeff Jarvis, qui estime que l’extraction de données sur le Web pour la formation de l’IA est une utilisation équitable, a signé. Il a déclaré à WIRED qu’il était judicieux que les acteurs du secteur de l’information s’unissent pour permettre aux entreprises d’IA d’accéder à des « informations crédibles et actuelles » à inclure dans leurs publications. « J’espère que ProRata ouvrira la discussion sur ce qui pourrait devenir des API [application programming interfaces] pour divers contenus », dit-il.

Après l’annonce initiale de la société, Gross dit avoir reçu un déluge de messages d’autres entreprises lui demandant de s’inscrire, y compris un SMS de la PDG de Time, Jessica Sibley. ProRata a conclu un accord avec Time, a confirmé l’éditeur à WIRED. Il prévoit de conclure des accords avec des YouTubeurs de renom et d’autres stars en ligne.

Le mot clé ici est « projets ». L’entreprise en est encore à ses débuts et Gross ne tarit pas d’éloges. Pour preuve de concept, ProRata va lancer en octobre son propre moteur de recherche de type chatbot par abonnement. Contrairement à d’autres produits de recherche basés sur l’IA, l’outil de recherche de ProRata utilisera exclusivement des données sous licence. Il n’y aura aucune récupération à l’aide d’un robot d’exploration Web. « Rien de Reddit », dit-il.

Ed Newton-Rex, ancien dirigeant de Stability AI qui dirige aujourd’hui l’association Fairly Trained, spécialisée dans la gestion éthique des licences de données, se dit encouragé par les débuts de ProRata. « C’est formidable de voir une entreprise d’IA générative accorder des licences sur les données de formation avant de publier son modèle, contrairement à l’approche de nombreuses autres entreprises », déclare-t-il. « Les accords qu’ils ont conclus démontrent une fois de plus l’ouverture des entreprises de médias à travailler avec de bons acteurs. »

Gross souhaite que le moteur de recherche démontre que la qualité des données est plus importante que leur quantité et estime que limiter le modèle à des sources d’information fiables permettra de limiter les hallucinations. « Je soutiens que 70 millions de bons documents sont en fait supérieurs à 70 milliards de mauvais documents », dit-il. « Cela permettra d’obtenir de meilleures réponses. »

De plus, Gross pense qu’il peut amener suffisamment de personnes à s’inscrire à ce moteur de recherche d’IA entièrement sous licence pour gagner suffisamment d’argent pour payer à ses fournisseurs de données la part qui leur est attribuée. « Chaque mois, les partenaires recevront un relevé de notre part indiquant : « Voici ce que les gens recherchent, voici comment votre contenu a été utilisé et voici votre au prorata « Vérifie », dit-il.

D’autres startups se bousculent déjà pour se faire une place dans ce nouveau monde de licences de données de formation, comme les marketplaces TollBit et Human Native AI. Une association à but non lucratif appelée Dataset Providers Alliance a été créée au début de l’été pour faire pression en faveur de normes plus strictes en matière de licences ; parmi ses membres fondateurs figurent des services comme Global Copyright Exchange et Datarade.

Le modèle économique de ProRata repose en partie sur son projet de céder ses technologies d’attribution et de paiement sous licence à d’autres entreprises, notamment des acteurs majeurs de l’IA. Certaines de ces entreprises ont commencé à conclure leurs propres accords avec des éditeurs (The Atlantic et Axel Springer, par exemple, ont des accords avec OpenAI). Gross espère que les entreprises d’IA trouveront plus abordable de céder sous licence les modèles de ProRata que de les créer en interne.

« Je vais accorder une licence d’utilisation du système à tous ceux qui veulent l’utiliser », explique Gross. « Je veux que ce soit si bon marché que ce soit comme des frais de Visa ou de MasterCard. »

Cet article a été initialement publié sur wired.com.

Source-147

- Advertisement -

Latest