L’entreprise commune d’EuroHPC a récemment déployé le premier supercalculateur pré-exascale d’Europe, LUMI, dans la ville finlandaise de Kajaani. La version entièrement AMD se classe au 3e rang des ordinateurs les plus rapides selon le classement Top500 en raison de ses performances de 550 pétaflops. Il revendique également le titre de troisième supercalculateur le plus écologique au monde, grâce à l’impressionnante efficacité énergétique des processeurs Epyc et des GPU MI250X basés sur CDNA. Selon LUMI, atteindre cette performance avec les ordinateurs portables les plus rapides au monde nécessiterait une pile de 23 km de haut, soit environ 28 fois plus haut que le plus haut bâtiment du monde, le Burj Khalifa de Dubaï.
LUMI a été conçu pour tirer 100 % de son énergie de sources renouvelables. Il pourra alimenter jusqu’à 200 MW d’énergie grâce à l’hydroélectricité, tandis que la chaleur perdue du supercalculateur sera réutilisée vers le quartier de Kajaani, dont les températures atmosphériques peuvent atteindre -18 Cº en hiver. Il s’agit d’une topologie de consommation d’énergie circulaire et ouvre les portes à un supercalcul véritablement respectueux de l’environnement et à empreinte carbone négative.
LUMI, le résultat d’un consortium de 10 pays, vise à fournir aux chercheurs d’Europe et du monde entier une plate-forme évolutive capable de booster les calculs prospectifs sur le climat, la recherche en intelligence médicale et artificielle, et même les simulations informatiques quantiques. Le logiciel sous-jacent est alimenté par la pile logicielle ROCm d’AMD, qui contraste avec CUDA de NVIDIA grâce à son approche open source. Il dispose également d’un mécanisme de traduction qui peut adapter le code basé sur CUDA à la pile logicielle d’AMD avec un minimum d’efforts d’ingénierie logicielle.
L’architecture de LUMI présente une topologie en étoile, avec huit nœuds partitionnés convergeant via l’interconnexion haut débit Slingshot de Cray (200 Gb/s). L’un d’entre eux, LUMI-G, est purement accéléré par GPU, avec pas moins de 10 240 GPU AMD Instinct MI250X répartis sur 2 560 nœuds (chaque nœud comprenant quatre GPU et un seul processeur AMD Epyc 7763 « Trento » à 64 cœurs), avec quatre liaisons 200 Gb/s entre les nœuds GPU. Chaque AMD Instinct MI250X dispose de 128 Go de VRAM HBM3 (bande passante de 3,2 To/s) et est évalué à 42,2 TFLOP/s de performances dans les benchmarks HPL. Au total, les GPU d’AMD offrent des performances de 432 128 TFLOP/s et plus de 1 To de VRAM adressable.
La partition LUMI-C offre une accélération basée sur le processeur, déployant 1 536 processeurs AMD Trento à double socket et 64 cœurs (totalisant 196 608 cœurs AMD Zen 3). Dans le même temps, une autre partition est dédiée aux charges de travail en cours, offrant un total de 32 To de RAM pouvant contenir d’immenses ensembles de données. En ce qui concerne le stockage des données, LUMI a adopté une topologie hybride : les données chaudes sont conservées dans un système Lustre 100 % flash de 8 Po (PetaByte). Un total de 80 Po de stockage classique sur disque dur transite par Lustre. Un nœud compatible avec le cloud est chargé de maintenir la puissance de LUMI à la portée de tous les chercheurs du monde disposant d’une connexion Internet.
Les plans d’expansion de LUMI incluent LUMI-Q, un nœud entièrement dédié à la frontière émergente de l’informatique quantique. LUMI voit l’avenir comme quantique-classique, s’appuyant sur un hybride HPC (calcul haute performance) + QC (calcul quantique) comme le lieu où les applications du monde réel trouveront leur avantage quantique. Bien que ce nœud n’ait toujours pas été installé localement, LUMI a jusqu’à présent été relié avec succès à deux ordinateurs quantiques : le centre suédois Chalmers/Wallenberg pour la technologie quantique QAL 900 et le premier ordinateur quantique finlandais, le Helmi, exploité par VTT.
Cependant, le déploiement de LUMI a été affecté par l’écrasement en cours des semi-conducteurs, et le système a été ajouté par phases tout au long de cette année. Le lancement pilote du système est prévu en août 2022, ses prouesses de supercalcul s’ouvrant pour une disponibilité générale en septembre de cette année. L’empreinte du supercalculateur occupera près de 400 m2, soit environ la taille de deux courts de tennis. Il appartient également à la catégorie des poids lourds, avec environ 150 000 kilogrammes (150 tonnes métriques) de puissance de calcul.
LUMI est non seulement le joyau de la couronne européenne pour le supercalcul, mais également un porte-drapeau pour les côtelettes HPC et les architectures respectueuses du climat de plus en plus pertinentes d’AMD, et sa conception témoigne de l’ingéniosité collaborative de l’humanité.