Pourquoi « l’IA générative » est soudainement sur toutes les lèvres : c’est un « champ ouvert »

Si vous avez suivi de près les progrès d’Open AI, la société dirigée par Sam Altman dont les réseaux de neurones peuvent désormais écrire du texte original et créer des images originales avec une facilité et une rapidité étonnantes, vous pourriez simplement sauter cette pièce.

Si, d’un autre côté, vous n’avez prêté que vaguement attention aux progrès de l’entreprise et à la traction croissante que d’autres entreprises d’IA dites « génératives » gagnent soudainement et que vous voulez mieux comprendre pourquoi, vous pourriez bénéficier de cette interview avec James Currier, quintuple fondateur et maintenant investisseur en capital-risque, a cofondé la société NFX il y a cinq ans avec plusieurs de ses amis fondateurs en série.

Currier tombe dans le camp des personnes qui suivent de près les progrès – si étroitement que NFX a fait de nombreux investissements connexes dans la «technologie générative» comme il le décrit, et cela attire de plus en plus l’attention de l’équipe chaque mois. En fait, Currier ne pense pas que le buzz autour de cette nouvelle ride sur l’IA n’est pas tant un battage médiatique qu’une prise de conscience que le monde des startups au sens large est soudainement confronté à une très grande opportunité pour la première fois depuis longtemps. « Tous les 14 ans », dit Currier, « nous avons une de ces explosions cambriennes. Nous en avions un sur Internet en 1994. Nous en avions un autour des téléphones mobiles en 2008. Maintenant, nous en aurons un autre en 2022. »

Rétrospectivement, cet éditeur aurait aimé poser de meilleures questions, mais j’apprends ici aussi. Des extraits de notre chat suivent, édités pour plus de longueur et de clarté. Vous pouvez écouter notre conversation plus longue ici.

TC : Il y a beaucoup de confusion à propos de l’IA générative, notamment à quel point elle est nouvelle ou si elle est simplement devenue le dernier mot à la mode.

JC : Je pense que ce qui est arrivé au monde de l’IA en général, c’est que nous avions le sentiment que nous pouvions avoir une IA déterministe, qui nous aiderait à identifier la vérité de quelque chose. Par exemple, est-ce une pièce cassée sur la chaîne de fabrication ? Est-ce une réunion appropriée à avoir? C’est là que vous déterminez quelque chose en utilisant l’IA de la même manière qu’un humain détermine quelque chose. C’est en grande partie ce qu’a été l’IA au cours des 10 à 15 dernières années.

Les autres ensembles d’algorithmes de l’IA étaient plutôt ces algorithmes de diffusion, qui visaient à examiner d’énormes corpus de contenu, puis à en générer quelque chose de nouveau, en disant : « Voici 10 000 exemples ». Pouvons-nous créer le 10 001e exemple similaire ? »

Celles-ci étaient assez fragiles, assez cassantes, jusqu’à il y a environ un an et demi. [Now] les algorithmes se sont améliorés. Mais plus important encore, les corpus de contenu que nous avons examinés ont grossi parce que nous avons simplement plus de puissance de traitement. Donc, ce qui s’est passé, c’est que ces algorithmes chevauchent la loi de Moore – [with vastly improved] stockage, bande passante, vitesse de calcul – et sont soudainement devenus capables de produire quelque chose qui ressemble beaucoup à ce qu’un humain produirait. Cela signifie que la valeur faciale du texte qu’il écrira et la valeur faciale du dessin qu’il dessinera ressemblent beaucoup à ce qu’un humain fera. Et tout cela s’est passé au cours des deux dernières années. Ce n’est donc pas une idée nouvelle, mais elle vient d’atteindre ce seuil. C’est pourquoi tout le monde regarde ça et dit : « Wow, c’est magique.

C’est donc la puissance de calcul qui a soudainement changé la donne, et non une infrastructure technologique auparavant manquante ?

Il n’a pas changé d’un coup, il a juste changé graduellement jusqu’à ce que la qualité de sa génération arrive là où elle était significative pour nous. Donc la réponse est généralement non, les algorithmes ont été très similaires. Dans ces algorithmes de diffusion, ils se sont quelque peu améliorés. Mais vraiment, il s’agit de la puissance de traitement. Puis, il y a environ deux ans, le [powerful language model] GPT est sorti, qui était un type de calcul sur site, puis GPT3 est sorti où [the AI company Open AI] ferait [the calculation] pour vous dans le cloud ; parce que les modèles de données étaient tellement plus volumineux, ils devaient le faire sur leurs propres serveurs. Tu ne peux pas te permettre de le faire [on your own]. Et à ce moment-là, les choses ont vraiment explosé.

Nous le savons parce que nous avons investi dans une entreprise qui fait des jeux génératifs basés sur l’IA, y compris « AI Dungeon », et je pense que la grande majorité de tous les calculs de GPT-3 provenaient de « AI Dungeon » à un moment donné.

« AI Dungeon » nécessite-t-il alors une équipe plus petite qu’un autre fabricant de jeux?

C’est l’un des gros avantages, absolument. Ils n’ont pas à dépenser tout cet argent pour héberger toutes ces données, et ils peuvent, avec un petit groupe de personnes, produire des dizaines d’expériences de jeu qui en profitent toutes. [In fact] l’idée est que vous allez ajouter une IA générative aux anciens jeux, afin que vos personnages non-joueurs puissent réellement dire quelque chose de plus intéressant qu’ils ne le font aujourd’hui, bien que vous obteniez des expériences de jeu fondamentalement différentes de l’IA au jeu , par rapport à l’ajout d’IA dans les jeux existants.

Donc un gros changement est dans la qualité ? Cette technologie plafonnera-t-elle à un moment donné ?

Non, ce sera toujours de mieux en mieux. C’est juste que les différences d’incréments seront plus petites avec le temps parce qu’elles deviennent déjà assez bonnes,

Mais l’autre grand changement est que Open AI n’était pas vraiment ouvert. Ils ont généré cette chose incroyable, mais elle n’était pas ouverte et coûtait très cher. Alors des groupes se sont réunis comme Stability AI et d’autres personnes, et ils ont dit: « Faisons juste des versions open source de cela. » Et à ce moment-là, le coût a chuté de 100 fois, rien qu’au cours des deux ou trois derniers mois.

Ce ne sont pas des ramifications d’Open AI.

Toute cette technologie générative ne sera pas construite uniquement sur le modèle Open AI GPT-3 ; ce n’était que le premier. La communauté open source a maintenant reproduit une grande partie de leur travail, et ils ont probablement huit mois, six mois de retard, en termes de qualité. Mais ça va y arriver. Et parce que les versions open source coûtent un tiers, un cinquième ou un vingtième du coût de l’Open AI, vous allez voir beaucoup de concurrence sur les prix, et vous allez voir une prolifération de ces modèles qui concurrencent l’Open AI . Et vous allez probablement vous retrouver avec cinq, ou six, ou huit, ou peut-être, peut-être 100 d’entre eux.

Ensuite, en plus de ceux-ci, des modèles d’IA uniques seront construits. Vous pouvez donc avoir un modèle d’IA qui cherche vraiment à faire de la poésie, ou des modèles d’IA qui regardent vraiment comment vous faites des images visuelles de chiens et de poils de chien, ou vous en aurez un qui est vraiment spécialisé dans la rédaction d’e-mails de vente. Vous allez avoir toute une couche de ces modèles d’IA spécialisés qui seront ensuite spécialement conçus. Ensuite, en plus de cela, vous aurez toute la technologie générative, qui sera : comment inciter les gens à utiliser le produit ? Comment faire en sorte que les gens paient pour le produit ? Comment inciter les gens à se connecter ? Comment amener les gens à le partager ? Comment créer des effets de réseau ?

Qui gagne de l’argent ici ?

La couche d’application où les gens vont aller après la distribution et les effets de réseau est là où vous allez gagner de l’argent.

Que dire des grandes entreprises qui pourront intégrer cette technologie dans leurs réseaux. Ne sera-t-il pas très difficile pour une entreprise qui n’a pas cet avantage de sortir de nulle part et de gagner de l’argent ?

Je pense que ce que vous recherchez est quelque chose comme un Twitch où YouTube aurait pu intégrer cela dans son modèle, mais ils ne l’ont pas fait. Et Twitch a créé une nouvelle plate-forme et une nouvelle partie précieuse de la culture et de la valeur pour les investisseurs et les fondateurs, même si c’était difficile. Vous allez donc avoir de grands fondateurs qui vont utiliser cette technologie pour leur donner un avantage. Et cela créera une couture sur le marché. Et pendant que les grands font autre chose, ils pourront construire des entreprises d’un milliard de dollars.

Le New York Times a récemment publié un article mettant en vedette une poignée de créatifs qui ont déclaré que les applications d’IA génératives qu’ils utilisent dans leurs domaines respectifs sont des outils dans une boîte à outils plus large. Les gens sont naïfs ici ? Risquent-ils d’être remplacés par cette technologie ? Comme vous l’avez mentionné, l’équipe travaillant sur « AI Dungeon » est plus petite. C’est bon pour l’entreprise mais potentiellement mauvais pour les développeurs qui auraient pu travailler sur le jeu autrement.

Je pense qu’avec la plupart des technologies, il y a une sorte de malaise que les gens ont de [for example] robots remplaçant un emploi dans une usine automobile. Lorsque Internet est arrivé, de nombreuses personnes qui faisaient du publipostage se sont senties menacées par le fait que les entreprises pourraient vendre directement et ne pas utiliser leurs services de publicité sur papier. Mais [after] ils ont adopté le marketing numérique ou la communication numérique par e-mail, ils ont probablement connu d’énormes bosses dans leur carrière, leur productivité a augmenté, la vitesse et l’efficacité ont augmenté. La même chose s’est produite avec les cartes de crédit en ligne. Nous ne nous sommes pas sentis à l’aise de mettre des cartes de crédit en ligne jusqu’en 2002 peut-être. Mais ceux qui ont adopté [this wave in] 2000 à 2003 ont fait mieux.

Je pense que ce qui se passe maintenant. Les écrivains, les concepteurs et les architectes qui pensent à l’avenir et adoptent ces outils pour se donner une productivité multipliée par 2, 3 ou 5 vont s’en sortir incroyablement bien. Je pense que le monde entier va finir par voir une augmentation de la productivité au cours des 10 prochaines années. C’est une énorme opportunité pour 90% des gens de faire plus, d’être plus, de faire plus, de se connecter plus.

Pensez-vous que c’était un faux pas de la part d’Open AI de ne pas [open source] ce qu’il construisait, compte tenu de ce qui a surgi autour de lui ?

Le leader finit par se comporter différemment des suiveurs. Je ne sais pas, je ne suis pas à l’intérieur de l’entreprise, je ne peux pas vraiment le dire. Ce que je sais, c’est qu’il va y avoir un grand écosystème de modèles d’IA, et je ne sais pas comment un modèle d’IA reste différencié car ils asymptote tous vers la même qualité et cela devient juste un jeu de prix. Il me semble que les gagnants sont Google Cloud et AWS parce que nous allons tous générer des trucs comme des fous.

Il se peut qu’Open AI finisse par monter ou descendre. Peut-être qu’ils deviennent eux-mêmes comme un AWS, ou peut-être qu’ils commencent à fabriquer des IA spécialisées qu’ils vendent à certains marchés verticaux. Je pense que tout le monde dans cet espace aura l’occasion de bien faire s’il navigue correctement; ils vont juste devoir être intelligents à ce sujet.

NFX a beaucoup plus sur son site sur l’IA générative qui vaut la peine d’être lu, soit dit en passant ; vous pouvez trouver cela ici.

Source-146