Jeudi, OpenAI a annoncé un système de plugin pour son assistant ChatGPT AI. Les plugins donnent à ChatGPT la possibilité d’interagir avec le monde entier via Internet, y compris la réservation de vols, la commande de courses, la navigation sur le Web, etc. Les plugins sont des morceaux de code qui indiquent à ChatGPT comment utiliser une ressource externe sur Internet.
Fondamentalement, si un développeur souhaite donner à ChatGPT la possibilité d’accéder à n’importe quel service réseau (par exemple : « consulter le cours actuel des actions ») ou d’effectuer n’importe quelle tâche contrôlée par un service réseau (par exemple : « commander une pizza via Internet »), c’est désormais possible, à condition de ne pas aller à l’encontre des règles d’OpenAI.
Classiquement, la plupart des grands modèles de langage (LLM) comme ChatGPT ont été contraints dans une bulle, pour ainsi dire, ne pouvant interagir avec le monde que par le biais de conversations textuelles avec un utilisateur. Comme OpenAI l’écrit dans son article de blog d’introduction sur les plugins ChatGPT, « La seule chose que les modèles de langage peuvent faire immédiatement est d’émettre du texte ».
Bing Chat a poussé ce paradigme plus loin en lui permettant de rechercher sur le Web des informations plus récentes, mais jusqu’à présent, ChatGPT a toujours été isolé du reste du monde. Bien que fermé de cette manière, ChatGPT ne peut s’appuyer que sur les données de son ensemble de formation (limité à 2021 et avant) et sur toute information fournie par un utilisateur pendant la conversation. De plus, ChatGPT peut être enclin à commettre des erreurs factuelles et des erreurs (ce que les chercheurs en IA appellent des « hallucinations »).
Pour contourner ces limitations, OpenAI a fait éclater la bulle et créé une interface de plugin ChatGPT (ce qu’OpenAI appelle les « yeux et les oreilles » de ChatGPT) qui permet aux développeurs de créer de nouveaux composants qui « se connectent » à ChatGPT et permettent au modèle d’IA d’interagir avec autres services sur Internet. Ces services peuvent effectuer des calculs et référencer des informations factuelles pour réduire les hallucinations, et ils peuvent également potentiellement interagir avec tout autre service logiciel sur Internet, si les développeurs créent un plugin pour cette tâche.
De quel type de plugins parle-t-on ?
Dans le cas de ChatGPT, OpenAI permettra aux utilisateurs de choisir parmi une liste de plugins avant de démarrer une session ChatGPT. Ils se présentent presque comme des applications dans un magasin d’applications, chaque plugin ayant sa propre icône et sa propre description.
OpenAI indique qu’une première série de plugins a été créée par les sociétés suivantes :
- Expedia (pour la planification du voyage)
- FiscalNote (pour les données de marché en temps réel)
- Instacart (pour les commandes d’épicerie)
- Kayak (recherche de vols et de voitures de location)
- Klarna (pour comparer les prix)
- Milo (un assistant parental alimenté par l’IA)
- OpenTable (pour les recommandations de restaurants et les réservations)
- Shopify (pour faire des achats sur ce site)
- Slack (pour les communications)
- Parler (pour le tutorat de langue alimenté par l’IA)
- Wolfram (pour le calcul et les données en temps réel)
- Zapier (une plateforme d’automatisation)
En particulier, le plug-in Zapier semble particulièrement puissant puisqu’il accorde à ChatGPT l’accès à un système d’automatisation de logiciel existant, ou comme le dit Zapier : « Vous pouvez demander à ChatGPT d’exécuter n’importe laquelle des 50 000 actions de Zapier (y compris la recherche, la mise à jour et l’écriture) avec Zapier. Plus de 5 000 applications prises en charge, transformant le chat en action. Il peut écrire un e-mail, puis l’envoyer pour vous. Ou rechercher des contacts dans un CRM, puis les mettre à jour directement. Ou ajouter des lignes à une feuille de calcul, puis les envoyer sous forme de message Slack. les possibilités sont infinies. »
OpenAI héberge également trois plugins lui-même, un navigateur Web (qui peut récupérer des informations sur le Web d’une manière similaire à Bing Chat), un interpréteur de code pour exécuter des programmes Python (dans un bac à sable) et un outil de récupération qui permet d’accéder à » sources d’informations personnelles ou organisationnelles hébergées ailleurs (essentiellement, extraction d’informations à partir de documents).