Le robot d’entrepôt Digit d’Agility comprend les commandes en langage naturel grâce à l’intelligence artificielle

Agility Robotics a partagé mercredi une vidéo de démonstration de l’un de ses robots Digit mis à niveau avec l’IA. Bien que cela puisse évoquer des images terrifiantes de la culture pop de machines de science-fiction sensibles conquérant le monde, la vidéo de démonstration révèle quelque chose de beaucoup plus banal, voire ennuyeux. Le robot d’entrepôt bipède travaille péniblement pour accomplir une tâche légèrement déroutante sans contrôle humain direct ni conseils détaillés. Dans le clip, il interprète et exécute lentement mais avec succès la commande : « Prenez la boîte qui est de la couleur du sabre laser de Dark Vador et déplacez-la vers la tour la plus haute de la première rangée. »

La société, qui a ajouté une « tête » et des « mains » à Digit plus tôt cette année, présente la démonstration comme un aperçu de la façon dont les grands modèles de langage (LLM) peuvent améliorer ses machines humanoïdes. Il suggère que c’est un choix naturel, décrivant Digit comme « une incarnation physique de l’intelligence artificielle ».

« Nous avons créé un espace de démonstration avec une série de tours numérotées de plusieurs hauteurs, ainsi que trois boîtes aux multiples caractéristiques déterminantes », a expliqué Pras Velagapudi, vice-président de l’innovation et architecte en chef d’Agility Robotics, dans le clip. « Digit a reçu des informations sur cet environnement, mais n’a reçu aucune information spécifique sur ses tâches. Juste des commandes en langage naturel de complexité variable pour voir s’il pouvait les exécuter.

Image tirée d'une vidéo de démonstration du robot Digit tenant une caisse rouge.  Une superposition en bas à gauche révèle le monologue intérieur du robot, tandis qu'une autre en bas à droite montre une carte 3D que le robot utilise pour la navigation.

Robotique d’agilité

Le clip montre le monologue intérieur de Digit, battement par battement, superposé à l’écran pendant que le robot réfléchit à sa tâche. Par exemple, « Je devrais découvrir quelles commandes je peux utiliser », « Je devrais d’abord évaluer l’environnement pour voir quels objets et emplacements sont disponibles » et « Le sabre laser de Dark Vador est rouge, et donc la case rouge (case 2) est celui que je dois déplacer. La tour la plus haute de la première rangée est la tour 4. Je vais d’abord me déplacer vers l’emplacement de la boîte 2. »

Après s’être déplacé vers l’emplacement de la case rouge, Digit continue. «Maintenant que je suis à l’emplacement de la box2, je devrais le récupérer», raisonne-t-il. Il continue : « Maintenant que j’ai la case 2, je dois me déplacer vers l’emplacement de la tour la plus haute de la première rangée, qui est la tour 4 » et « Maintenant que je suis à la tour4, je dois y placer la case 2. » Enfin, il déclare son travail terminé : « Je crois avoir terminé la tâche, car j’ai déplacé la boîte de la couleur du sabre laser de Dark Vador (rouge, boîte 2) vers la tour la plus haute de la première rangée (tour 4). »

Agility Robotics, qui présente Digit comme épargnant les travailleurs humains des activités physiques les plus éprouvantes, affirme avoir créé la démo pour « montrer comment les LLM pourraient rendre nos robots plus polyvalents et plus rapides à déployer ». L’entreprise construit une usine dans l’Oregon pour produire 10 000 robots humanoïdes par an. Il a également signé un accord avec Amazon pour que le détaillant teste Digit dans une installation de la région de Seattle. Mis à part les peurs alimentées par la fiction, les robots sont beaucoup plus susceptibles de blesser les humains en leur volant leurs emplois dans les entrepôts qu’en se métamorphosant, en assassinant des innocents ou en reconstituant d’autres cauchemars dystopiques alimentés par Hollywood.

Source-145