Le rêve de voir un robot vous préparer le petit-déjeuner, prendre en charge vos tâches ménagères ou faire plus que votre robot aspirateur classique pourrait être un pas de plus grâce à une nouvelle recherche du laboratoire d’IA DeepMind de Google.
Trois nouveaux documents de recherche de DeepMind couvrant l’automatisation, les temps de réaction et le suivi des mouvements des robots leur permettent de travailler plus efficacement dans le monde réel.
Les techniques permettent aux robots d’utiliser de puissants modèles de langage étendus, tels que celui qui alimente ChatGPT, pour apprendre et comprendre des tâches complexes sans avoir à être formés à partir de zéro pour chaque nouvelle fonction.
Donner aux robots un cerveau et une constitution
Dans une série de vidéos montrant le potentiel de la recherche, on peut voir les robots ramasser des canettes de soda, ouvrir et fermer des tiroirs et même nettoyer une surface.
Auparavant, chacune des parties de ces tâches nécessitait des lignes de code et une formation spécifique. La nouvelle recherche permet aux robots d’apprendre en observant, en examinant l’environnement et en accomplissant eux-mêmes la tâche en temps réel.
Il existe également une nouvelle constitution de robot qui définit les règles de sécurité à la fois pour les robots et pour le système décisionnel sous-jacent de grand modèle de langage. Basés sur les célèbres trois lois de la robotique d’Isaac Asimov, elles disent essentiellement de ne pas nuire aux humains.
AutoRT donne une vision aux robots
La première des nouvelles technologies est AutoRT, une technique qui apprend à plusieurs robots à la fois à effectuer différentes tâches dans différents environnements en même temps.
Ils utilisent un modèle de langage visuel pour étudier l’environnement et les objets et alimentent ces données dans un grand modèle de langage. Ce modèle agit en tant que décideur pour le bot et lui indique quelle tâche il doit effectuer ensuite et comment effectuer cette tâche.
Ce système a été testé pendant sept mois et a permis de former 20 robots. Au total, ils ont effectué 6 650 tâches individuelles pendant la période de formation pour affiner la collecte et le traitement des données.
SARA permet aux robots d’effectuer eux-mêmes des modifications
L’attention robuste auto-adaptative pour les transformateurs robotiques (ou SARA-RT en abrégé) est un nouveau système évolutif qui permet aux robots d’améliorer leurs instructions en fonction des commentaires du monde réel. C’est une manière d’affiner le modèle pour qu’il fonctionne le plus efficacement possible.
Le robot peut collecter des données spatiales provenant de ses caméras et des informations provenant d’autres capteurs et les utiliser pour choisir le meilleur chemin vers l’achèvement d’une tâche donnée.
La technique finale fournit des données de contour visuelles aux robots qui peuvent ajouter des descriptions aux données d’entraînement. Il peut utiliser ces données supplémentaires pour généraliser plus efficacement et améliorer sa compréhension de la tâche qu’il doit accomplir.
Il ne s’agit que d’un premier projet de recherche de DeepMind, travaillant sur la technologie sous-jacente plutôt que de la déployer sur des produits opérationnels. Alors ne vous attendez pas à ce qu’un androïde vous prépare un café de si tôt.