La superpuce Grace de Nvidia a fait des vagues lors de son introduction plus tôt cette année, car la société a promis un produit basé sur Arm suralimenté qui pourrait prendre la domination x86 d’Intel et d’AMD dans l’espace de calcul haute performance (HPC). Aujourd’hui, comme l’a rapporté HPC Wire, la société a décroché un contrat de 160 millions de dollars (~ 151 millions d’euros) pour fournir les cerveaux et les muscles du matériel de supercalcul pour l’un des projets de supercalcul d’EuroHPC. Le MareNostrum 5 (MareNostrum se traduit approximativement par « notre mer ») sera installé au Barcelona Supercomputing Center (BSC) en Espagne et sera opérationnel dès 2023.
Mare Nostrum 5 est en cours de construction dans le cadre du projet EuroHPC JU et devrait offrir des performances de pointe de 314 pétaflops de puissance de calcul FP 64 sur les accélérateurs CPU et GPU, avec 200 pétaoctets de stockage pour les charges de travail en accès, et un autre 400 pétaoctets de stockage à froid. Suivant les tendances en matière de conception d’architecture HPC et d’autres projets du projet EuroHPC, il est prévu que le nœud de 200 pétaoctets soit conservé dans un sous-système de stockage rapide basé sur NAND, tandis que le nœud de stockage à froid (également appelé stockage actif, se référant aux données cruciales mais pas fréquemment consultés) utiliseront probablement des topologies de disque dur classiques plus économiques.
Le système utilisera les « superpuces » Grace basées sur Arm à 144 cœurs de Nvidia dans des configurations à double puce, associées aux accélérateurs GPU discrets H100 (Hopper) de la société (qui comportent 80 milliards de transistors chacun avec 80 Go de mémoire HBM3 et 3,2 To/ bande passante). En conséquence, MareNostrum 5 devrait fournir plus de 18 exaflops d’accélération de l’IA (généralement des opérations à virgule flottante FP8 8 bits), ce qui en fait le supercalculateur d’IA le plus rapide de l’Union européenne. Outre la technologie de puce de Nvidia, la mise en réseau définie par logiciel Quantum-2 (alias NDR) InfiniBand de la société (s’ouvre dans un nouvel onglet) en tirant parti des unités de traitement de données BlueField (DPU) de la société pour que tous les composants continuent de parler à faible latence avec un débit élevé de 400 Go/s – un peu comme les performances obtenues par l’interconnexion Slingshot de Cray.
Des spéculations éclairées de The Next Platform estiment que MareNostrum 5 pourrait déployer jusqu’à 4 500 accélérateurs « Hopper » H100, ce qui serait également bon pour environ 270 pétaflops de puissance FP64 grâce aux cœurs Tensor de la puce. Les 44 pétaflops restants de performances FP64 devraient provenir des systèmes à double processeur Grace, qui, selon la publication, fournissent 3,84 téraflops par puce Grace, soit un total probable d’environ 5 730 modules Grace doubles.
MareNostrum 5 est particulièrement destiné à la recherche médicale, aux simulations chimiques et au développement de médicaments tout en prenant en charge des applications telles que la science du climat et l’ingénierie environnementale. Le progiciel Omniverse de Nvidia (s’ouvre dans un nouvel onglet) alimentera le développement de jumeaux numériques pour ces applications – permettant essentiellement des simulations à grande échelle et physiquement précises d’actifs et de processus à l’échelle industrielle. La technologie de jumeau numérique permet l’intégration de systèmes autonomes avec des flux de données en temps réel dans le monde réel, permettant un système de rétroaction circulaire de simulation, de sortie et de mises à jour à la volée sur les modèles simulés.
« L’acquisition de MareNostrum 5 permettra des percées scientifiques révolutionnaires telles que la création de jumeaux numériques pour aider à résoudre des défis mondiaux tels que le changement climatique et l’avancement de la médecine de précision », a déclaré Mateo Valero, directeur de BSC. « En outre, [BSC] s’engage à développer du matériel européen à utiliser dans les futures générations de supercalculateurs et à contribuer à la réalisation de la souveraineté technologique des États membres de l’UE. »
De plus, comme c’est le cas avec cette dernière génération de supercalculateurs installés dans toute l’Europe, MareNostrum 5 sera entièrement alimenté par des énergies renouvelables, la chaleur excédentaire étant réutilisée – au lieu d’être simplement expulsée sans destination.
Il est actuellement difficile de savoir exactement comment l’excès de chaleur sera réutilisé (et dans quelle proportion). Il suivra probablement les mêmes principes de conception que le leader européen actuel dans le domaine du supercalcul, le supercalculateur LUMI installé à Kajaani, en Finlande, entièrement alimenté par AMD, qui réutilise 20 % de sa chaleur perdue vers le quartier civil environnant, permettant des réductions de dépense énergétique supplémentaire pour le chauffage.