Ce robot guépard s’est appris à sprinter d’une manière étrange

C’est probablement pour le meilleur que les bébés humains ne peuvent pas courir 9 miles par heure peu de temps après la naissance. Il faut des années de pratique pour ramper puis bien marcher, période pendant laquelle les mères n’ont pas à s’inquiéter que leurs enfants sortent du comté. Cependant, les roboticiens n’ont pas ce genre de temps à perdre, alors ils développent des moyens pour que les machines apprennent à se déplacer par essais et erreurs, tout comme les bébés, mais bien plus vite.

Vidéo : MIT

Ouais, OK, ce que vous regardez dans la vidéo ci-dessus n’est pas la locomotion la plus gracieuse. Mais les scientifiques du MIT ont annoncé la semaine dernière qu’ils avaient obtenu que cette plate-forme de recherche, une machine à quatre pattes connue sous le nom de Mini Cheetah, atteigne sa vitesse la plus rapide de tous les temps – près de 13 pieds par seconde, ou 9 miles par heure – et non en codant méticuleusement à la main ses mouvements. ligne par ligne, mais en encourageant les versions numériques de la machine à expérimenter le fonctionnement dans un monde simulé. Ce sur quoi le système a atterri est… non conventionnel. Mais les chercheurs ont pu transposer ce que le robot virtuel a appris dans cette machine physique qui pourrait ensuite traverser toutes sortes de terrains sans tomber sur son, euh, visage.

Cette technique est connue sous le nom d’apprentissage par renforcement. Pensez-y comme si vous suspendiez un jouet devant un bébé pour l’encourager à ramper, seulement ici les chercheurs ont simulé 4 000 versions du robot et les ont encouragés à apprendre d’abord à marcher, puis à courir dans plusieurs directions. Les Mini Cheetahs numériques ont fait des essais sur des surfaces simulées uniques qui avaient été programmées pour avoir certains niveaux de caractéristiques, comme le frottement et la douceur. Cela a préparé les robots virtuels à la gamme de surfaces qu’ils auraient dû affronter dans le monde réel, comme l’herbe, la chaussée, la glace et le gravier.

Les milliers de robots simulés pouvaient essayer toutes sortes de façons différentes de bouger leurs membres. Les techniques qui ont entraîné la rapidité ont été récompensées, tandis que les mauvaises ont été rejetées. Au fil du temps, les robots virtuels ont appris par essais et erreurs, comme le fait un humain. Mais parce que cela se passait numériquement, les robots ont pu apprendre façon plus rapide : seulement trois heures de temps de pratique dans la simulation équivalaient à 100 heures dans le monde réel.

Vidéo : MIT

Ensuite, les chercheurs ont transféré ce que les robots numériques avaient appris sur la course sur différentes surfaces dans le Mini Cheetah réel. Le robot n’a pas de caméra, il ne peut donc pas voir son environnement pour ajuster sa démarche. Au lieu de cela, il calcule son équilibre et garde une trace de la façon dont ses pas le propulsent vers l’avant. Par exemple, s’il marche sur de l’herbe, il peut se référer à son entraînement numérique sur une surface avec le même frottement et la même douceur que le gazon réel. « Plutôt qu’un humain prescrivant exactement comment le robot doit marcher, le robot apprend à partir d’un simulateur et de l’expérience pour atteindre essentiellement la capacité de courir en avant et en arrière, et de tourner très, très rapidement », explique Gabriel Margolis, chercheur en IA à MIT qui a co-développé le système.

Le résultat n’est pas particulièrement élégant, mais il est stable et rapide, et le robot l’a fait en grande partie tout seul. Mini Cheetah peut dévaler une colline alors que le gravier se déplace sous les pieds et garder son équilibre sur des plaques de glace. Il peut se remettre d’un trébuchement et même s’adapter pour continuer à bouger si l’une de ses pattes est désactivée.

Pour être clair, ce n’est pas nécessairement le moyen le plus sûr ou le plus économe en énergie pour le robot de fonctionner – l’équipe optimisait uniquement la vitesse. Mais c’est un changement radical par rapport à la prudence avec laquelle les autres robots doivent se déplacer dans le monde. « La plupart de ces robots sont vraiment lents », explique Pulkit Agrawal, chercheur en IA au MIT qui a co-développé le système. « Ils ne marchent pas vite ou ils ne peuvent pas courir. Et même quand ils marchent, ils marchent droit. Ou ils peuvent tourner, mais ils ne peuvent pas adopter des comportements agiles comme tourner à grande vitesse.

Source-144