Intel avait initialement prévu que ses puces Falcon Shores aient à la fois des cœurs GPU et CPU sous le capot, créant ainsi le premier «XPU» de la société pour le calcul haute performance. Cependant, son annonce surprise il y a quelques mois qu’il basculerait vers une conception uniquement GPU et retarderait les puces à 2025 a laissé les observateurs de l’industrie choqués – cela laisse Intel incapable de rivaliser avec les processeurs Instinct MI300 d’AMD et Grace Hopper de Nvidia qui disposent tous deux d’un mélange Conception CPU + GPU.
Aujourd’hui, Intel a fourni une partie de sa justification quelque peu discutable derrière la décision de réduire ses plans pour Falcon Shores pour en faire le successeur uniquement GPU de la série de GPU Xeon Max. Intel a également esquissé certains des premiers détails de sa nouvelle conception Falcon Shores uniquement GPU, que nous aborderons plus loin.
Intel a également publié une nouvelle feuille de route HPC et AI qui ne montre pas de successeur au processeur Gaudi3 – à la place, Gaudi et les GPU fusionnent avec le GPU Falcon Shores alors qu’il prend le relais de la première puce HPC et AI d’Intel. Intel nous a dit qu’il « prévoyait d’intégrer le produit Habana et AXG [GPU] feuilles de route », mais les détails de l’intégration sont légers.
L’architecture de calcul de Gaudi varie considérablement d’un GPU standard, il ne semble donc pas que son architecture de calcul puisse être entièrement intégrée aux GPU. En tant que tel, Intel pourrait incorporer de plus petites parties de la conception de Gaudi, comme son interface réseau ou d’autres blocs IP, dans ses GPU. On nous dit que Jeff McVeigh, vice-président et directeur général du groupe d’informatique accélérée d’Intel, fournira plus de détails aujourd’hui. Pour rappel, Intel a payé 2 milliards de dollars pour Habana Labs et a tué les produits de son acquisition de Nervana pour 350 millions de dollars pour se concentrer sur les puces Gaudi.
Intel a partagé quelques détails de base sur la nouvelle conception de Falcon Shores, qui continuera de se concentrer sur les charges de travail HPC et AI mais utilisera des cœurs GPU. Les XPU Falcon Shores axés sur HPC ont été conçus pour les applications de supercalcul avec des plans pour fusionner les technologies CPU et GPU dans un seul package de puces mix-and-match, mais ils arriveront désormais pour la première fois en tant qu’architecture GPU uniquement en 2025.
Falcon Shores utilisera une commutation Ethernet standard, un peu comme l’architecture Gaudi axée sur l’IA d’Intel, une quantité non spécifiée de mémoire HBM3 et des « E/S conçues pour évoluer », ce qui signifie probablement que Falcon Shores sera livré avec différentes options de capacité de mémoire. Intel dit que Falcon viendra avec jusqu’à 288 Go de HBM3 et 9,8 To/s de débit mémoire total. Comme prévu, il prendra en charge des types de données plus petits, comme FP8 et BF16.
L’esquisse de base de l’appareil comprend également une interface de programmation commune basée sur GPU, OneAPI, qui permettra une large compatibilité avec d’autres processeurs et architectures. Intel répertorie également la prise en charge de CXL comme un différenciateur clé, ce qui nous amène à sa justification derrière le retrait des cœurs de processeur du package Falcon Shores.
Intel affirme que son objectif initial de mélanger les cœurs CPU et GPU dans le même package Falcon Shores était prématuré. Comme le montre la diapositive ci-dessus, Intel affirme que la combinaison optimale de cœurs CPU et GPU a évolué au fil du temps à mesure que les charges de travail ont évolué, et la société s’attend à des changements encore plus rapides et radicaux du rapport CPU/GPU optimal avec l’explosion de l’IA générative et les LLM dans l’espace HPC. En tant que tel, Intel dit qu’il ne pense pas que le moment soit venu de verrouiller les clients dans des ratios CPU et GPU spécifiques.
Cependant, comme indiqué ci-dessus, le plan original de Falcon Shores incluait la possibilité d’ajuster les ratios CPU/GPU en ajoutant un nombre différent de tuiles CPU ou GPU dans la conception à quatre tuiles, lui permettant ainsi de configurer le mélange optimal pour diverses charges de travail. En outre, de par leur conception, les supercalculateurs à la pointe de la technologie sont des conceptions hautement spécialisées pour la tâche à accomplir, et le réglage logiciel de l’architecture est simplement une partie courante de l’exploitation d’un supercalculateur. Ces facteurs impliquent que les ratios CPU/GPU ne sont pas la seule raison pour laquelle Intel a retiré les cœurs de processeur de la conception.
Intel indique également qu’il permet à ses clients d’utiliser différents processeurs, qui incluraient logiquement les puces x86 d’AMD et les puces Arm de Nvidia, avec leur conception GPU, n’obligeant ainsi pas les clients à choisir les cœurs x86 d’Intel plutôt que d’autres sociétés. Mais, encore une fois, les plans originaux d’Intel incluaient également des variantes GPU et CPU uniquement de Falcon Shores, donc cette justification ne semble pas non plus convaincante.
Intel affirme qu’il tirera parti de l’interface CXL pour permettre à ses clients de tirer parti d’une architecture composable capable de lier divers ratios CPU/GPU dans leurs conceptions personnalisées. Cependant, l’interface CXL ne fournit que 64 Go/s de débit entre les éléments, tandis que les conceptions CPU + GPU personnalisées comme Grace Hopper de Nvidia peuvent fournir jusqu’à 1 To/s de débit mémoire entre le CPU et le GPU. Cela confère à la fois des avantages en termes de performances et d’efficacité par rapport à une implémentation CXL pour de nombreux types de charges de travail, en particulier les charges de travail d’IA gourmandes en bande passante mémoire. Sans parler des connexions à latence intrinsèquement plus faible entre les éléments et d’autres avantages, comme une densité de performances plus élevée.
C’est-à-dire que même si l’idée d’Intel d’une architecture plus composable convient à certaines charges de travail, elle ne pourra probablement pas rivaliser avec le MI300 d’AMD ou le Grace de Nvidia en termes de puissance, de coût ou de performances pour certaines applications.
De même, la décision d’Intel de ralentir la cadence de sortie de son GPU n’est pas idéale car il devra exploiter des produits plus anciens pour concurrencer des architectures beaucoup plus avancées pour HPC, comme les Grace Superchips de Nvidia et le futur APU exascale d’AMD, l’Instinct MI300, qui se lancent tous deux en 2023.
Malgré la justification d’Intel pour changer ses objectifs, il est difficile de ne pas voir la redéfinition par Intel de Falcon Shores en un produit uniquement GPU, car la société manque un point d’inflexion architectural qui la placera dans une situation de désavantage concurrentiel à l’avenir.