Exclusif : Fuite du puissant processeur AI Gaudi 2 HL 2080 de nouvelle génération d’Intel

Nous avons quelque chose de très intéressant pour nos lecteurs aujourd’hui. Nous avons récemment mis la main sur des documents internes qui confirment qu’Intel se prépare à lancer un accélérateur de formation IA de nouvelle génération avec des capacités monstrueuses plus tard cette année. Surnommée la plate-forme Habana Gaudi 2, elle visera les nouveaux produits de centre de données de NVIDIA (lancés plus tard cette semaine) pour un apprentissage en profondeur et vise à fournir une alternative à plus grande valeur (du point de vue du TCO). Gardez à l’esprit que les documents étaient datés du début de cette année et que la fenêtre de lancement * aurait pu * bouger pendant cette période, alors prenez cela avec un grain de sel.

Intel se prépare à « jouer à l’offensive » avec le processeur d’apprentissage en profondeur Habana Gaudi 2, lancé en mai 2022

Les offres Habana d’Intel sont divisées en deux catégories : la formation à l’IA et l’inférence à l’IA. La plate-forme Gaudi est la plate-forme de formation à l’IA et Goya est la plate-forme d’inférence à l’IA. La puce Gaudi 2 succèdera aux anciennes puces Gaudi proposées par Intel. Alors que la documentation que nous avons acquise ne parlait que d’une puce Gaudi 2, [caution: editorial speculation] il est possible qu’une puce Goya 2 soit également en préparation [/editorial speculation] – puisque la formation et l’inférence de l’IA sont généralement une offre combinée par la plupart des fournisseurs. Les fournisseurs peuvent utiliser la plate-forme Gaudi d’Intel à l’aide de l’instance Amazon AWS EC2DL1, où elle offre déjà 40 % de meilleures performances par dollar que les instances basées sur NVIDIA.

Nous avons également la toute première photo de la puce Intel HL 2080 AI basée sur la plate-forme Gaudi 2 :

Notre tout premier regard exclusif sur la nouvelle puce Habana Gaudi 2, HL 2080 d’Intel avec 6 matrices HBM.

Bien que nous n’ayons reçu aucune information supplémentaire sur la puce Gaudi 2 HL 2080, nous pouvons voir que 6 HBM meurt. Si ceux-ci sont de type HBM2, cela fait au total 48 Go de mémoire embarquée. S’il s’agit du type HBM3, alors le ciel est la limite et il pourrait être de 96 Go (ou plus). Nous pouvons également voir les pastilles de soudure pour un total de 24 VRM pour ce qui semble être une conception à 12 + 12 phases. C’est environ 50% de puissance en plus que l’ancienne puce Habana qui avait une conception 8 + 8 pour un total de 16 VRM. En supposant qu’il s’agisse de puces de taille HBM standard, il semble également qu’Intel ait augmenté la taille de la matrice de 50 % par rapport à la dernière génération de processeurs Gaudi. Je ne vais pas faire ici une estimation de la taille d’un dé et je laisserai inévitablement mes collègues le faire.

Cependant, pour avoir une bonne idée de l’augmentation approximative du nombre de transistors, nous devons également connaître le processus sur lequel la puce est construite. Nous savons que la puce Intel Gaudi 2 HL 2080 est construite sur « un » processus de 7 nm basé sur cette interview d’Eitan Medina, COO de Habana Labs. Malheureusement, cela ne nous aide pas vraiment beaucoup car 7 nm pourrait faire référence au processus N7 sur TSMC, Intel 7 (anciennement Intel 10 nm) ou Intel 4 (anciennement Intel 7 nm et le moins probable). Les processeurs Habana Gaudi d’origine ont été construits sur le processus TSMC 16 nm, ce qui rend plus probable que cette puce soit sur N7 ou Intel 7. Quoi qu’il en soit, étant donné que la plate-forme Gaudi 2 est clairement sur un nœud beaucoup plus petit que 16 nm (qui dans lui-même donne une augmentation de densité d’environ 50 %), et combiné à l’augmentation de la taille de la matrice, nous examinons une bête absolue d’un processeur qui devrait facilement aller de pair avec le prochain GPU de centre de données Hopper de NVIDIA – en termes de performances par dollar – et peut-être même en termes de performances absolues.

Le PDG d’Intel, Pat Gelsinger, a précédemment fait allusion à une « voie très agressive » pour sa branche Habana AI :

« Nous jouons offensif, pas défensif ».

Nous avons également, avec notre gamme de produits Habana [a specialized A.I. chipmaker Intel bought in 2019]a incontestablement tracé une voie très agressive et notre partenariat cloud avec [hotlink]Amazone[/hotlink] en est une belle démonstration. Donc clairement, je dirais que l’idée des processeurs est la provenance d’Intel. Nous intégrons maintenant l’IA à cela et nous nous attendons à ce que ce soit un domaine où nous sommes en attaque, pas en défense à l’avenir.

via Yahoo Finance

Depuis son acquisition par Intel, Habana Labs aurait eu beaucoup plus de ressources pour jouer et il semble que la société se prépare à prendre au sérieux les applications DL/ML. Intel a enfin une feuille de route de produits très réelle qui pourrait résister – et même prendre des parts de marché à NVIDIA.

Source-123