Le laboratoire national d’Argonne et Intel ont annoncé jeudi que l’installation de 10 624 lames pour le supercalculateur Aurora est terminée et que le système sera mis en ligne plus tard en 2023. La machine utilise des dizaines de milliers de processeurs Xeon Max ‘Sapphire Rapids’ avec mémoire HBM2E ainsi que des dizaines de milliers de GPU de calcul Data Center GPU Max ‘Ponte Vecchio’ pour atteindre des performances de plus de 2 FP64 ExaFLOPS.
Le supercalculateur Aurora construit par HPE se compose de 166 racks avec 64 lames par rack, pour un total de 10 624 lames. Chaque lame Aurora est basée sur deux processeurs Xeon Max avec 64 Go de mémoire HBM2E intégrée ainsi que sur six GPU de calcul Intel Data Center Max « Ponte Vecchio ». Ces CPU et GPU seront refroidis avec un système de refroidissement liquide personnalisé.
Au total, le supercalculateur Aurora contient 21 248 processeurs à usage général avec plus de 1,1 million de cœurs hautes performances, 19,9 pétaoctets (Po) de mémoire DDR5, 1,36 Po de mémoire HBM2E attachée aux processeurs et 63 744 GPU de calcul conçus pour les charges de travail IA et HPC massivement parallèles. avec 8,16 Po de mémoire HBM2E intégrée. Les lames sont interconnectées à l’aide du tissu Slingshot de HPE conçu spécifiquement pour les supercalculateurs.
« Aurora est le premier déploiement du GPU Max Series d’Intel, le plus grand système basé sur un processeur Xeon Max et le plus grand cluster de GPU au monde », a déclaré Jeff McVeigh, vice-président d’Intel et directeur général du Super Compute Group. « Nous sommes fiers de faire partie de ce système historique et ravis de l’IA, de la science et de l’ingénierie révolutionnaires qu’Aurora permettra. »
Le supercalculateur Aurora utilise une gamme de 1 024 nœuds de stockage composés de dispositifs de stockage à semi-conducteurs et fournissant 220 To de capacité ainsi que 31 To/s de bande passante totale, ce qui sera pratique pour gérer les charges de travail impliquant des ensembles de données volumineux, tels que la recherche sur la fusion nucléaire, génie scientifique, simulations physiques, recherche sur la guérison, prévisions météorologiques et autres tâches.
Alors que l’installation des lames Aurora est terminée, le supercalculateur doit encore passer les tests d’acceptation. Lorsqu’il le sera et sera mis en ligne plus tard cette année, il promet d’atteindre un pic de performance théorique au-delà de 2 ExaFLOPS, ce qui en fera le premier supercalculateur à atteindre ce niveau de performance lorsqu’il rejoindra les rangs de la liste Top500.
« Pendant que nous travaillons aux tests d’acceptation, nous allons utiliser Aurora pour former des modèles d’IA générative open source à grande échelle pour la science », a déclaré Rick Stevens, directeur de laboratoire associé du Laboratoire national d’Argonne. « Aurora, avec plus de 60 000 GPU Intel Max, un système d’E/S très rapide et un système de stockage de masse entièrement à semi-conducteurs, est l’environnement idéal pour former ces modèles. »
Alors que le supercalculateur Aurora doit encore passer les tests et qu’ANL doit encore soumettre ses résultats de performances à Top500.org, Intel a profité de l’occasion pour partager les avantages de performances de son matériel par rapport aux solutions concurrentes d’AMD et de Nvidia.
Selon Intel, les tests préliminaires avec les GPU de la série Max montrent qu’ils excellent dans les « charges de travail scientifiques et techniques du monde réel », offrant des performances deux fois plus élevées que les GPU AMD Instinct MI250X sur OpenMC, et presque parfaitement évolutifs sur des centaines de nœuds. De plus, Intel affirme que son processeur Intel Xeon Max Series offre un avantage de 40 % en termes de performances par rapport à ses concurrents dans de nombreuses applications HPC du monde réel, notamment HPCG, NEMO-GYRE, Anerlastic Wave Propagation, BlackScholes et OpenFOAM.