Le battage médiatique se développe sur les agents d’IA « autonomes » qui bouclent les sorties GPT-4

Agrandir / Une image générée par l’IA d’un « robot auto-améliorant ».

À mi-parcours

Depuis le lancement de l’API GPT-4 d’OpenAI le mois dernier pour les bêta-testeurs, un groupe lâche de développeurs a expérimenté la création d’implémentations de type agent (« agentique ») du modèle d’IA qui tentent d’effectuer des tâches en plusieurs étapes avec aussi peu d’intervention humaine. que possible. Ces scripts homebrew peuvent boucler, itérer et générer de nouvelles instances d’un modèle d’IA selon les besoins.

Deux projets open source expérimentaux, en particulier, ont attiré beaucoup d’attention sur les médias sociaux, en particulier parmi ceux qui battage publicitaire Projets d’IA sans relâche : Auto-GPT, créé par Toran Bruce Richardset BabyAGI, créé par Yohei Nakajima.

Que font-ils? Eh bien, en ce moment, pas beaucoup. Ils ont besoin de beaucoup d’intervention humaine et de main-d’œuvre en cours de route, ils ne sont donc pas encore aussi autonomes que promis. Mais ils représentent les premières étapes vers des modèles d’IA de chaînage plus complexes qui pourraient potentiellement être plus capables qu’un seul modèle d’IA fonctionnant seul.

« Atteignez de manière autonome l’objectif que vous vous fixez »

Richards décrit son script comme « une application open source expérimentale présentant les capacités du modèle de langage GPT-4 ». Le script « enchaîne les » pensées « LLM pour atteindre de manière autonome l’objectif que vous vous êtes fixé. »

Fondamentalement, Auto-GPT prend la sortie de GPT-4 et la réinjecte avec une mémoire externe improvisée afin qu’elle puisse itérer davantage sur une tâche, corriger des erreurs ou suggérer des améliorations. Idéalement, un tel script pourrait servir d’assistant IA qui pourrait effectuer n’importe quelle tâche numérique par lui-même.

Pour tester ces affirmations, nous avons exécuté Auto-GPT (un script Python) localement sur une machine Windows. Lorsque vous le démarrez, il vous demande un nom pour votre agent IA, une description de son rôle et une liste de cinq objectifs qu’il tente de remplir. Lors de sa configuration, vous devez fournir une clé API OpenAI et une clé API de recherche Google. Lors de l’exécution, Auto-GPT demande la permission d’effectuer chaque étape qu’il génère par défaut, bien qu’il inclue également un mode entièrement automatique si vous vous sentez aventureux.

S’il est chargé de faire quelque chose, comme « Acheter une paire d’Air Jordan vintage », Auto-GPT développera un plan en plusieurs étapes et tentera de l’exécuter. Par exemple, il peut rechercher des vendeurs de chaussures, puis rechercher une paire spécifique qui répond à vos critères. Mais c’est à ce moment-là qu’il s’arrête parce qu’il ne peut rien acheter pour le moment. Si vous êtes connecté à une API d’achat appropriée, cela pourrait être possible.

Si vous voulez avoir un avant-goût de ce que fait Auto-GPT vous-même, quelqu’un a créé une version Web appelée AgentGPT qui fonctionne de manière similaire.

Richards a été très ouvert sur son objectif avec Auto-GPT : développer une forme d’IAG (intelligence générale artificielle). Dans l’IA, « l’intelligence générale » fait généralement référence à la capacité encore hypothétique d’un système d’IA à effectuer un large éventail de tâches et à résoudre des problèmes qui ne sont pas spécifiquement programmés ou formés.

Une capture d'écran d'AgentGPT, basée sur Auto-GPT, exécutant une tâche consistant à tenter d'acheter une paire de chaussures Air Jordan vintage.
Agrandir / Une capture d’écran d’AgentGPT, basée sur Auto-GPT, exécutant une tâche consistant à tenter d’acheter une paire de chaussures Air Jordan vintage.

Ars Technica

Comme un humain raisonnablement intelligent, un système doté d’une intelligence générale devrait être capable de s’adapter à de nouvelles situations et d’apprendre de l’expérience, plutôt que de simplement suivre un ensemble de règles ou de modèles prédéfinis. Cela contraste avec les systèmes dotés d’une intelligence étroite ou spécialisée (parfois appelée « IA étroite »), qui sont conçus pour effectuer des tâches spécifiques ou fonctionner dans une gamme limitée de contextes.

Pendant ce temps, BabyAGI (qui tire son nom d’un objectif ambitieux de travailler vers l’intelligence générale artificielle) fonctionne de manière similaire à Auto-GPT mais avec une saveur différente axée sur les tâches. Vous pouvez en essayer une version sur le Web sur un site pas si modestement intitulé « God Mode ».

Nakajima, le créateur de BabyAGI, nous dit qu’il a été inspiré pour créer son script après avoir été témoin du mouvement « HustleGPT » en mars, qui cherchait à utiliser GPT-4 pour créer automatiquement des entreprises en tant que type de cofondateur de l’IA, pour ainsi dire. « Cela m’a rendu curieux de savoir si je pouvais créer un fondateur entièrement IA », déclare Nakajima.

La raison pour laquelle Auto-GPT et BabyAGI ne correspondent pas à AGI est due aux limites de GPT-4 lui-même. Bien qu’impressionnant en tant que transformateur et analyseur de texte, GPT-4 se sent toujours limité à une gamme étroite d’intelligence interprétative, malgré certaines affirmations selon lesquelles Microsoft aurait vu des « étincelles » de comportements de type AGI dans le modèle. En fait, l’utilité limitée d’outils comme Auto-GPT pour le moment peut constituer la preuve la plus puissante à ce jour des limites actuelles des grands modèles de langage. Cela ne signifie pas pour autant que ces limitations ne seront pas surmontées.

De plus, la question des confabulations – lorsque les LLM inventent simplement des choses – peut s’avérer une limitation significative de l’utilité de ces assistants de type agent. Par exemple, dans un fil Twitter, quelqu’un a utilisé Auto-GPT pour générer un rapport sur les entreprises qui produisent des chaussures imperméables en faisant une recherche sur le Web et en consultant les avis sur les produits de chaque entreprise. À n’importe quelle étape du processus, le GPT-4 pourrait avoir des critiques, des produits ou même des entreprises entières potentiellement « hallucinées » qui ont pris en compte son analyse.

Lorsqu’on lui a demandé une application utile de BabyAGI, Nakajima n’a pas pu trouver d’exemples concrets à part « Do Anything Machine », un projet construit par Garrett Scott qui aspire à créer une liste de tâches auto-exécutable, qui est actuellement en développement . Pour être juste, le projet BabyAGI n’a qu’une semaine environ. « C’est plus une introduction à un cadre/une approche, et ce qui est le plus excitant, c’est ce que les gens sont construire sur cette idée, » il dit.

Source-147