La nouvelle puce IA d’IBM offre une accélération 22x avec une efficacité énergétique « époustouflante »

IBM a récemment lancé un nouveau prototype de puce d’intelligence artificielle (IA), censé être à la fois plus rapide et beaucoup plus économe en énergie que n’importe quelle puce actuellement disponible.

D’après les recherches publié dans Science Magazine du 19 octobre, la nouvelle puce, baptisée NorthPole, « atteint une métrique d’énergie 25 fois supérieure » sur une référence pertinente « et une métrique de temps de latence 22 fois inférieure ».

Apparemment, cela se traduit par le potentiel de performances post-GPU à une fraction du coût en énergie.

Damien Querlioz, chercheur en nanoélectronique à l’Université Paris-Saclay à Palaiseau, a qualifié l’efficacité énergétique de NorthPole d’« époustouflante » dans un article. publié dans la nature.

Selon l’article de l’équipe IBM Research :

« NorthPole surpasse toutes les architectures courantes, même celles qui utilisent des processus technologiques plus avancés. »

L’un des principaux obstacles à l’amélioration du traitement de l’IA est appelé le « goulot d’étranglement de von Neumann ». Grâce à l’architecture actuellement disponible, les puces IA ont tendance à avoir des capacités de traitement plus rapides que la mémoire dont elles ont besoin pour exécuter les processus. En conséquence, une latence est introduite chaque fois que des informations sont envoyées entre l’unité de traitement et la mémoire vive.

Cela est particulièrement vrai à la « périphérie », où les puces et les données sont stockées ensemble. La suppression de ce goulot d’étranglement a longtemps été considérée par de nombreux experts comme la clé pour exécuter localement de puissants réseaux de neurones sur les appareils.

Selon IBM Research, le nouveau prototype de puce construit dans le laboratoire d’Alamaden, en Californie, contourne le goulot d’étranglement de von Neumann en intégrant essentiellement le composant mémoire sur la puce de traitement elle-même.

Comme l’a dit le principal développeur de la puce, Dharmendra Modha, NorthPole est « un réseau complet sur une puce » qui « trace une voie complètement différente de l’architecture de von Neumann ».

La puce NorthPole sur une carte PCIe. Source : Recherche IBM

La référence utilisée pour démontrer l’efficacité de la puce, ResNet50, est un réseau neuronal à 50 couches principalement utilisé pour tester des tâches de vision par ordinateur telles que la classification d’images.

Les résultats rapportés par le matériel NorthPole sur cette référence indiquent qu’il pourrait fonctionner exceptionnellement bien dans des tâches associées telles que la chirurgie autonome, le fonctionnement de voitures et d’autres véhicules autonomes, ainsi que de nombreux projets liés à la robotique.

IBM Research travaille déjà depuis des années sur la prochaine puce utilisant l’architecture NorthPole. Selon sur le blog de l’entreprise, « Ce n’est que le début du travail de Modha sur NorthPole. »