Google a publié un nouveau benchmark open source qui, selon lui, permettra aux robots d’effectuer des tâches en écrivant leur propre code en réponse à des instructions écrites par l’homme.
La société a lancé un nouveau site Internet (s’ouvre dans un nouvel onglet) pour révéler le « code en tant que politiques » (CAP), dans lequel les invites écrites en anglais simple peuvent être interprétées dans des programmes générés par un modèle de langage (LMP) écrits en code Python.
CAP est le successeur de PaLM-SayCan (s’ouvre dans un nouvel onglet), un projet qui permettait également à un robot assistant physique d’être dirigé via des commandes en langage clair. CAP promet de permettre l’exécution de tâches plus complexes avec une précision accrue, en partie parce qu’elle permet aux machines d’écrire leur propre code.
Robots auto-codants
Dans un article de blog (s’ouvre dans un nouvel onglet) discutant de la sortie de CAP, Jacky Liang, stagiaire en recherche chez Google, et Andy Zeng, chercheur scientifique, décrivent la motivation de la technologie et ce qu’elle pourrait signifier pour l’avenir.
« Et si, lorsqu’ils recevaient des instructions de personnes, les robots pouvaient écrire de manière autonome leur propre code pour interagir avec le monde ? […] Compte tenu des instructions en langage naturel, les modèles de langage actuels sont très compétents pour écrire non seulement du code générique mais, comme nous l’avons découvert, du code qui peut également contrôler les actions du robot.
Mais ce n’est peut-être pas encore le moment de jeter votre ordinateur portable pour la programmation. Lors des tests, les chercheurs de Google ont démontré des commandes simples avec une structure similaire. Les robots de test ont pu « dessiner un hexagone de 5 cm autour du milieu » [of a whiteboard]et « placez les blocs sur une ligne horizontale près du sommet » [of a square boundary].
Dans l’accompagnement papier (s’ouvre dans un nouvel onglet), intitulé « Code as Policies: Language Model Programs for Embodied Control », l’équipe du projet admet que CAP n’a actuellement pas la capacité de traiter des commandes particulièrement abstraites ou complexes ou de percevoir des descriptions de trajectoire. L’approche de l’équipe ne tenait pas non plus compte des commandes impossibles transmises via CAP.
En théorie, la nature open source de la mise en œuvre « centrée sur les robots » de Google des LMP en Python pourrait entraîner une mise en œuvre beaucoup plus rapide des solutions à ces problèmes. Le site Web de la PAC contient également libère (s’ouvre dans un nouvel onglet) via Github, et un interactif démo (s’ouvre dans un nouvel onglet) via Google Colab pour décrire comment les robots « écrivent » du code en réponse aux commandes.