Les détails d’AMD Instinct MI300 émergent et font leurs débuts dans 2 supercalculateurs Exaflop El Capitan

(Crédit image : Marco Chiappetta)

L’Instinct MI300 d’AMD s’annonce comme une puce incroyable avec des cœurs CPU et GPU et une lourde dalle de mémoire haute vitesse réunis sur le même processeur, mais les détails sont restés légers. Nous avons maintenant rassemblé de nouveaux détails à partir d’une présentation International Super Computing (ISC) 2023 qui décrit le prochain supercalculateur El Capitan à deux exaflops qui sera alimenté par l’Instinct MI300. Nous avons également trouvé d’autres détails dans un discours du CTO Mark Papermaster d’AMD à ITF World 2023, une conférence organisée par le géant de la recherche imec (vous pouvez lire notre interview avec Papermaster ici).

Le supercalculateur El Capitan est sur le point d’être le plus rapide au monde lorsqu’il s’allumera fin 2023, prenant la position de leader du Frontier alimenté par AMD. Le puissant Instinct MI300 d’AMD alimentera la machine, et de nouveaux détails incluent une carte topologique d’une installation MI300, des images du laboratoire Austin MI300 d’AMD et une image des nouvelles lames qui seront utilisées dans le supercalculateur El Capitan. Nous couvrirons également certains des autres nouveaux développements autour du déploiement d’El Capitan.

Pour rappel, l’Instinct MI300 est un APU de centre de données qui mélange un total de 13 chiplets, dont beaucoup sont empilés en 3D, pour créer un seul paquet de puces avec vingt-quatre cœurs de processeur Zen 4 fusionnés avec un moteur graphique CDNA 3 et huit piles de mémoire HBM3 totalisant 128 Go. Dans l’ensemble, la puce pèse 146 milliards de transistors, ce qui en fait la plus grande puce qu’AMD ait mise en production. Les neuf matrices de calcul, un mélange de processeurs et de GPU de 5 nm, sont empilées en 3D sur quatre matrices de base de 6 nm qui sont des interposeurs actifs qui gèrent la mémoire et le trafic d’E/S, entre autres fonctions.

Le discours d’ouverture de l’ITF World de Papermaster s’est concentré sur l’objectif « 30×25 » d’AMD d’augmenter l’efficacité énergétique de 30x d’ici 2025, et sur la façon dont l’informatique est désormais contrôlée par l’efficacité énergétique à mesure que la loi de Moore ralentit. La clé de cette initiative est l’Instinct MI300, et une grande partie de ses gains proviennent de la topologie simplifiée du système que vous voyez ci-dessus.

Comme vous pouvez le voir dans la première diapositive, un nœud alimenté par Instinct MI250 a des CPU et des GPU séparés, avec un seul CPU EPYC au milieu pour coordonner les charges de travail.

En revanche, l’Instinct MI300 contient un processeur EPYC Genoa de quatrième génération à 24 cœurs intégré à l’intérieur du boîtier, supprimant ainsi un processeur autonome de l’équation. Cependant, la même topologie globale reste, sans le processeur autonome, permettant une topologie tout-à-tout entièrement connectée avec quatre éléments. Ce type de connexion permet à tous les processeurs de se parler directement sans qu’un autre CPU ou GPU ne serve d’intermédiaire pour relayer les données vers les autres éléments, réduisant ainsi la latence et la variabilité. C’est un problème potentiel avec la topologie MI250. La carte topologique du MI300 indique également que chaque puce a trois connexions, comme nous l’avons vu avec le MI250. Les diapositives de Papermaster font également référence aux interposeurs actifs qui forment les matrices de base en tant que « matrice de base en tissu infini de quatrième génération ».

Comme vous pouvez le voir dans le reste de ces diapositives, le MI300 a placé AMD sur une voie claire pour dépasser ses objectifs d’efficacité 30X25 tout en dépassant la tendance de puissance de l’industrie. Nous avons également ajouté quelques photos du silicium Instinct MI300 que nous avons vu de première main, mais ci-dessous, nous voyons à quoi ressemble le MI300 à l’intérieur d’une lame réelle qui sera installée à El Capitan.

AMD Instinct MI300 dans El Capitan

Source-138