Intel a levé le voile sur une deuxième génération d’accélérateurs Gaudi qui pourraient réduire considérablement le temps nécessaire pour former des modèles d’IA à grande échelle.
Annoncés à Intel Vision 2022 à Dallas, les processeurs Gaudi 2 sont construits sur un processus de 7 nm, disposent de 24 ports RoCE 100GbE intégrés et disposent de la plus grande quantité de mémoire de tous les accélérateurs du marché (96 Go HBM2e).
Les nouveaux processeurs sont un produit de la société israélienne Habana Labs, qui a été absorbé par Intel en 2019, et sont conçus pour les serveurs dédié aux charges de travail d’apprentissage en profondeur.
Former des modèles d’IA
Ces dernières années, un certain nombre de modèles de traitement du langage naturel (TAL) et de vision par ordinateur à grande échelle ont émergé, offrant des performances bien supérieures aux entrées précédentes dans les disciplines respectives.
Le problème est que la formation de ces modèles de plusieurs milliards de paramètres est incroyablement intensive en calcul, et donc coûteuse et chronophage, un facteur limitant dans le développement de la technologie.
Cependant, avec les nouveaux accélérateurs Gaudi 2, le coût et le temps nécessaires pour développer de nouveaux modèles d’IA sophistiqués seront considérablement réduits, selon Intel.
Selon Eltan Medina, COO chez Habana, le rapport prix/performance est un facteur clé pour les clients, et a donc été une priorité lors du développement des accélérateurs de deuxième génération.
Les benchmarks présentés à Intel Visions suggèrent que les processeurs Gaudi 2 offrent environ 2 fois le débit de formation sur les charges de travail NLP et vision populaires (BERT et Restnet-50), par rapport au GPU A100 de Nvidia.
Dans le même temps, les nouvelles puces Gaudi devraient permettre une économie d’environ 40 % sur les deux types de charge de travail, encore une fois par rapport aux GPU A100.
« Intel fait progresser l’IA et la valeur pour les clients des centres de données avec les accélérateurs Habana, qui sont la solution optimale pour les serveurs dédiés à l’apprentissage en profondeur », a déclaré Medina. « Nous pensons que cette catégorie sera extrêmement importante. »
Les processeurs Gaudi 2 sont immédiatement disponibles pour les clients et sont également susceptibles de soutenir nuage instances d’AWS plus loin sur la ligne, comme avec la génération précédente.