Lors d’une visite sur le campus de Google, une découverte intrigante a été faite : un espace secret présentant des œuvres d’art, accompagné de démonstrations des projets Astra et Mariner. Astra, un assistant virtuel, interagit de manière fluide et en temps réel, tandis que Mariner, en phase de test, contrôle le navigateur pour effectuer des tâches. Bien que prometteurs, ces agents IA rencontrent des défis de rapidité et d’imprévisibilité, limitant leur déploiement à grande échelle.
En entrant dans une pièce remplie de livres sur la programmation et l’architecture, j’ai tout de suite remarqué une étagère légèrement inclinée. Derrière elle se cachait un espace secret, équipé de trois téléviseurs diffusant des chefs-d’œuvre artistiques : Le Cri d’Edvard Munch, Un après-midi de dimanche de Georges Seurat, et La Grande Vague de Kanagawa de Hokusai. « Ces œuvres sont fascinantes », a commenté Bibo Xu, responsable produit pour le projet Astra de Google. « Y a-t-il une œuvre en particulier que vous aimeriez explorer ? »
Découverte du projet Astra
Le projet Astra, une version prototype de l’« agent universel » développé par Google, a répondu avec aisance. « Nous avons déjà abordé Un après-midi de dimanche », a-t-il expliqué. « Souhaitez-vous discuter d’un détail précis ou préférez-vous parler de Le Cri ? »
J’étais sur le vaste campus de Google à Mountain View, découvrant les dernières innovations de son laboratoire d’intelligence artificielle, DeepMind. Astra, présenté pour la première fois lors de Google I/O, est un assistant virtuel qui fonctionne au sein d’une application. Il est capable d’analyser du texte, des images, des vidéos et de l’audio en temps réel tout en fournissant des réponses. Imaginez un mélange de Siri et d’Alexa, mais avec une interaction plus fluide, capable de percevoir votre environnement et de « se souvenir » des conversations antérieures. Aujourd’hui, Google a annoncé l’expansion de la phase de test d’Astra à davantage d’utilisateurs, y compris des essais avec des lunettes prototypes, même si aucune date de lancement n’a été précisée.
Un aperçu du Projet Mariner
Une autre nouveauté présentée est le Projet Mariner, un agent IA qui prend le contrôle de votre navigateur via une extension Chrome pour réaliser diverses tâches. Bien qu’encore en phase de développement, il a commencé à être testé par un groupe de « testeurs de confiance ».
Le projet Astra a achevé son test initial, et Google prévoit d’inclure les retours d’expérience dans ses prochaines mises à jour. Parmi les améliorations, on trouve une meilleure compréhension des accents variés, la capacité de mémoire portant jusqu’à 10 minutes, une latence réduite, ainsi qu’une intégration dans d’autres produits Google comme Search, Lens et Maps.
Lors de mes démonstrations, Google a précisé que je voyais des « prototypes de recherche » qui n’étaient pas encore prêts à être commercialisés. Les interactions étaient soigneusement orchestrées par le personnel de Google, et bien que j’aie posé plusieurs questions sur une éventuelle sortie publique, aucune réponse concrète n’a été fournie.
Alors que je me tenais dans cette bibliothèque secrète, le projet Astra partageait des faits fascinants sur Le Cri : quatre versions de cette œuvre emblématique ont été créées par Munch entre 1893 et 1910, la version la plus connue étant celle de 1893.
Dans une conversation interactive, Astra s’est montré enthousiaste mais un peu maladroit. « Bonjour Bibo », a-t-il déclaré au début de la démonstration. « Wow, c’était très impressionnant », a répondu Xu. « Peux-tu me dire— » Mais Astra, coupant la parole, a demandé : « Y avait-il un aspect de l’œuvre qui t’a particulièrement intéressé ? »
Eh bien… pas exactement.
L’essor des agents IA
De nombreuses entreprises d’IA, telles qu’OpenAI, Anthropic et Google, mettent en avant le dernier terme à la mode dans le monde technologique : les agents. Dans un communiqué, Sundar Pichai, le PDG de Google, les décrit comme des modèles capables de mieux comprendre leur environnement, de penser plusieurs étapes à l’avance et d’agir en votre nom tout en restant sous votre supervision.
Bien que ces agents semblent prometteurs, leur déploiement à grande échelle est compliqué en raison de l’imprévisibilité des systèmes d’IA. Par exemple, Anthropic a reconnu que son agent de navigateur avait « soudainement fait une pause » en pleine démonstration, se mettant à parcourir des photos de Yellowstone. Ce phénomène montre que les machines peuvent procrastiner tout comme nous. Les agents ne semblent pas encore prêts pour un usage de masse ou pour accéder à des données sensibles telles que les e-mails ou les comptes bancaires. Même lorsqu’ils respectent les instructions, ils peuvent être sujets à des détournements via des injections de commandes. Google a déclaré qu’il prendrait des mesures pour se défendre contre ces attaques en priorisant les instructions authentiques des utilisateurs, une approche également explorée par OpenAI.
Les démonstrations de Google sont restées à faible enjeu. Dans le cadre du projet Mariner, j’ai observé un employé ouvrir une recette dans Google Docs, utiliser l’extension Chrome pour activer Mariner, et taper : « Ajoute tous les légumes de cette recette à mon panier Safeway. »
Mariner est alors intervenu, prenant le contrôle du navigateur et énumérant les actions à accomplir, tout en cochant chaque tâche réalisée. Malheureusement, vous ne pouvez pas vraiment effectuer d’autres actions pendant qu’il recherche des ingrédients ; vous êtes contraint de rester à l’affût, observant la machine travailler à une allure si lente que j’aurais probablement terminé plus vite moi-même. Jaclyn Konzelmann, directrice de la gestion des produits chez Google, a visiblement perçu mon hésitation : « L’éléphant dans la pièce, c’est la rapidité. Ce n’est pas le cas pour l’instant, comme vous pouvez le constater, ça avance assez lentement. »