Nous savions déjà qu’AMD alimenterait le supercalculateur le plus rapide au monde – le Département américain de l’énergie (DOE) El Capitan. Prévu pour être installé en 2023 au Lawrence Livermore National Laboratory (LLNL), le système construit par HPE a initialement exploité les cœurs de processeur Zen 4 d’AMD et les accélérateurs GPU MI Instinct, débloquant des performances inouïes au-dessus de la barre des 2 Exaflop. Pourtant, il y a quelque chose que l’annonce initiale n’a pas dit : le système n’exploitera pas des accélérateurs CPU et GPU disparates. Au lieu de cela, confirmant nos spéculations, El Capitan tirera parti des unités de traitement accéléré (APU) MI 300 récemment annoncées par AMD. C’est la première fois qu’un APU est le grognement de traitement central d’un supercalculateur (s’ouvre dans un nouvel onglet)– et chez Exascale, pas moins.
« C’est la première fois que nous le disons publiquement », a déclaré Terri Quinn, directrice associée du HPC (High Performance Computing) au LLNL. Dans une première divulgation mondiale dans une présentation faite aujourd’hui au 79e forum des utilisateurs HPC au Oak Ridge National Laboratory (ORNL), il a ajouté que l’information venait directement de la source : «J’ai coupé ces mots de [AMD’s] document des investisseurs, et c’est ce qu’il dit : il s’agit d’une conception de puces 3D avec des GPU AMD CDNA3, des processeurs Zen 4, une mémoire cache et des puces HBM. »
Les APU MI300 d’AMD comprendront des puces CPU et GPU dans le même boîtier compatible 3D avec une architecture de mémoire HBM3 cohérente, alimentée par Infinity Fabric de 4e génération et Infinity Cache de nouvelle génération. Tirant parti à la fois de l’architecture d’accélération graphique Zen 4 et CDNA 3, les APU MI300 tireront parti de la technologie de traitement 5 nm de TSMC (probablement N5 ou N5P). Cependant, l’équilibre des cœurs CPU et GPU par APU est encore une supposition sauvage.
En tant qu’APU, El Capitan bénéficiera de ce qui sera probablement le profil de performances le plus dense jamais atteint dans le monde du supercalcul. Ne vous méprenez pas : El Capitan représentera le summum de la performance, de la conception et de l’intégration des semi-conducteurs. Il n’est pas exagéré de dire qu’il s’agira probablement de l’une des entreprises les plus complexes de l’humanité sur le plan technologique.
Tout cela grâce à des APU AMD étroitement emballés, regroupés dans des racks HPE Cray XE et liés au réseau Slingshot-11 de Cray, alimentés par ses contrôleurs Rosetta de 16 nanomètres qui peuvent fournir des interconnexions de 200 Gb/sec. Le facteur de forme et le nombre d’accélérateurs par rack est toujours un point d’interrogation. En fin de compte, Frontier devrait également devenir l’un des systèmes les plus économes en énergie (sinon le plus efficace), avec une puissance de fonctionnement limitée à 40 MW pour un équilibre performance/puissance optimal. Les charges de travail passeront par les circuits d’El Capitan à partir du 2e trimestre 2024, la fin de vie prévue étant fixée à 2030.
Le rôle continu d’AMD dans la liste Top500 des supercalculateurs les plus puissants au monde continue d’avancer à un rythme effréné. La société renforce la domination précédente d’Intel, obtenant déjà cinq des dix meilleurs supercalculateurs au monde – dont la première place, grâce à Frontier – contre le système unique basé sur Xeon d’Intel alimentant le Tianhe-2A chinois, actuellement classé neuvième (s’ouvre dans un nouvel onglet). La société a parcouru un long chemin depuis sa tristement célèbre et presque révolutionnaire famille d’architecture Steamroller.
Cependant, toutes les nouvelles ne sont pas mauvaises pour Intel, car la société a également obtenu un contrat Exascale avec le Laboratoire national d’Argonne. Le supercalculateur Aurora sera également un système HPE-Intel à 2 exaflops qui a déjà subi plusieurs révisions. L’installation d’Aurora est déjà en cours, bien que la date exacte de sa mise en service ne soit pas encore claire. Les retards d’Intel sur ses CPU Sapphire Rapids ont déjà poussé l’installation du supercalculateur, il reste donc à voir combien de temps prendra l’exécution.
Nvidia a également une présence pertinente dans les systèmes les plus performants au monde, bien qu’elle ne fonctionne actuellement que dans l’espace des fournisseurs de GPU, marquant trois systèmes alimentés par ses GPU. Mais il a récemment remporté un contrat essentiel en tant que fournisseur de CPU et de GPU pour MareNostrum 5, qui sera installé au Barcelona Supercomputing Center (BSC) en Espagne. L’opération pourrait commencer dès 2023.
Malheureusement, Nvidia a déjà adopté la nomenclature « Superchip » avec son produit de processeur Grace basé sur Arm pour les déploiements de calcul haute performance (HPC). Alors peut-être qu’AMD devrait déjà chercher à revendiquer une « Überchip » ?