Intel a annoncé jeudi l’une de ses prochaines étapes majeures dans les plates-formes de supercalcul: la conception du nom de code Falcon Shores qui réunira des cœurs de processeur x86 à usage général et des cœurs de GPU Xe-HPC de calcul hautement parallèles dans un seul socket, ainsi qu’une mémoire partagée à large bande passante développée par Intel. Le produit devrait arriver en 2024.
Le regroupement des ressources CPU x86 et GPU Xe-HPC dans le même socket ainsi que le passage à une architecture de mémoire unifiée permettront à Intel de multiplier par cinq la densité de calcul par socket par rapport aux plates-formes actuelles (en raison de nouvelles architectures, de technologies de traitement plus fines et l’ajout de cœurs GPU), multiplient par plus de cinq la capacité de mémoire et la bande passante par rapport aux conceptions existantes et augmentent les performances par watt de plus de cinq fois par rapport aux plates-formes disponibles en février 2022.
« Nous travaillons sur une toute nouvelle architecture nommée Falcon Shores, [which] réunira l’accélération GPU x86 et Xe dans un socket Xeon, tirant parti des technologies d’emballage, de mémoire et d’E/S de nouvelle génération, offrant d’énormes améliorations de performances et d’efficacité pour les systèmes calculant de grands ensembles de données et formant de gigantesques modèles d’IA », a déclaré Raja Koduri, le responsable du groupe Intel’s Accelerated Computing Systems and Graphics quelques heures seulement avant le coup d’envoi de la réunion des investisseurs 2022 de l’entreprise.
Pour l’instant, Intel appelle son Falcon Shores un XPU pour souligner qu’il contient deux types d’unités de calcul : les CPU et les GPU. Les Falcon Shores d’Intel utiliseront largement l’approche multi-chiplet/modulaire d’Intel pour la conception des processeurs et offriront un ratio flexible de cœurs x86 et Xe-HPC, éventuellement en fonction d’une application cible. Les tuiles CPU et GPU seraient fabriquées à l’aide d’un «processus de l’ère Angstrom», ce qui pourrait signifier Intel 20A ou Intel 18A, puis connectées à l’aide des technologies de conditionnement avancées d’Intel, qui seront les principaux catalyseurs de Falcon Shores. Le CPU et le GPU utiliseront une mémoire unifiée à large bande passante pour améliorer les performances et simplifier considérablement la programmation du GPU de calcul. Fait intéressant, Intel fait même allusion à un tout nouveau type de mémoire développé par Intel, mais ne donne pas de détails.
« Falcon Shores s’appuie sur une gamme impressionnante de technologies, y compris une technologie de processus de l’ère angström, un conditionnement de nouvelle génération, une nouvelle mémoire partagée à bande passante extrême développée par Intel et des E/S de pointe », a déclaré Koduri. « Nous sommes très enthousiastes à propos de cette architecture car elle apporte une accélération à une gamme de charges de travail beaucoup plus large que les solutions discrètes actuelles. »
Les supercalculateurs modernes utilisent des processeurs à usage général pour exécuter des charges de travail qui nécessitent de fortes performances à un seul thread, ainsi que des accélérateurs de calcul GPU pour des charges de travail hautement parallèles. Pour l’instant, cette architecture s’est avérée équilibrée en termes de performances, de puissance et de coûts, mais une intégration plus étroite des ressources CPU et GPU permettra d’augmenter encore les performances et rendra le calcul accéléré accessible à davantage de charges de travail.
Les Falcon Shores d’Intel seront l’une des étapes majeures d’Intel vers son objectif d’activer les supercalculateurs de classe ZettaFLOPS d’ici 2027. Pour augmenter les performances des supercalculateurs de 1000 fois en cinq ans, Intel dit qu’il aura besoin de nouvelles architectures de traitement (c’est-à-dire des améliorations des architectures x86 et Xe), de nouvelles technologies de processus et de méthodes de conditionnement avancées, une mémoire plus rapide et des interfaces d’E/S (bande passante extrême unifiée la mémoire et les interconnexions/conditionnements avancés semblent résoudre ce problème), et les nouvelles architectures système. Falcon Ridge rassemble tous les piliers nécessaires aux supercalculateurs de classe ZettaFLOPS, indique la société.
« En commençant par la base technologique que nous avons aujourd’hui, vous avez besoin de gains révolutionnaires significatifs en matière d’architecture, d’efficacité énergétique et de gestion thermique, de technologie de traitement et de conditionnement, de mémoire, de capacité d’E/S et de bande passante », a déclaré Koduri. « Nous avons déjà nos équipes de technologie de pointe en route avec des inventions pour ouvrir la voie à Zetta-Scale. »