Feuille de route AMD CDNA 3 : APU MI300 avec augmentation des performances/watts multipliée par 5

(Crédit image : AMD)

AMD a parlé de sa dernière feuille de route CDNA lors de sa journée des analystes financiers, et la grande nouvelle pour les graphiques de centre de données est la prochaine architecture CDNA 3 et l’APU MI300. Oui, vous avez bien vu : AMD va fabriquer un APU complet qui combine des puces CPU et GPU dans un seul produit.

À partir de CDNA 3, AMD affirme qu’il fournira plus de 5 fois la performance par watt (perf/watt) mise à niveau par rapport aux produits CDNA 2 existants. Cela peut sembler un exploit incroyable, mais creuser un peu plus profondément suggère un moyen simple pour AMD d’atteindre ce chiffre. Contrairement à ses produits graphiques grand public, CDNA contient des cœurs matriciels (similaires aux cœurs tenseurs de Nvidia). L’Instinct MI250X fournit actuellement jusqu’à 95,7 téraflops d’opérations matricielles FP64 maximales, soit quatre fois ce chiffre pour un débit maximal FP16 et bfloat16 de 383 téraflops. Le hic, c’est que le MI250X a les mêmes 383 téraflops pour les performances INT8 et INT4.

Il y a fort à parier que les affirmations d’AMD de 5X le perf/watt ne sont pas une augmentation universelle de l’efficacité pour FP64, FP32 et d’autres formats. Il est plus probable qu’AMD augmentera le débit INT8 pour qu’il soit le double du débit FP16/bfloat16, et INT4 pourrait encore le doubler. Cela fournirait une amélioration de 4X, et des améliorations architecturales de 25% feraient passer cela à 5X. AMD mentionne également de nouveaux formats mathématiques, qui iraient de pair avec cette amélioration des performances. Bien sûr, perf / watt est toujours une métrique nébuleuse de toute façon, alors classez-la comme une amélioration « jusqu’à 5X ou plus » et nous attendrons de voir à quoi ressemblent les performances réelles.

Outre les améliorations en termes de performances et d’efficacité, CDNA 3 contiendra un Infinity Fabric de 4e génération et un Infinity Cache de nouvelle génération. Comme prévu, CDNA 3 utilisera une technologie de processus de 5 nm, probablement TSMC N5 ou N5P. Cela devrait aider à atteindre les autres objectifs de la conception.

Diapositives de la Journée des analystes financiers d'AMD, 9 juin 2022

(Crédit image : AMD)

CDNA 3 passera également d’une architecture de mémoire cohérente utilisée dans CDNA 2 à une architecture de mémoire unifiée avec CDNA 3. Il s’agit d’une amélioration essentielle, car une grande partie de la puissance utilisée dans les charges de travail des centres de données est consacrée au déplacement des données. Réduire le besoin de copies redondantes peut augmenter considérablement l’efficacité globale, ce qui nous amène au point suivant.

La solution Instinct MI300 d’AMD comprendra à la fois des puces CPU et GPU dans l’emballage. AMD appelle cela le premier APU de centre de données, unité de traitement accéléré. C’est intéressant car AMD n’a pas autant utilisé le terme APU ces dernières années avec ses solutions Ryzen qui ont des graphiques intégrés. Il y aura peut-être une résurgence de la marque APU, mais la combinaison des cœurs de processeur Zen 4 et des cœurs de GPU CDNA 3 devrait s’avérer incroyablement puissante.

Diapositives de la Journée des analystes financiers d'AMD, 9 juin 2022

(Crédit image : AMD)

Le MI300 comportera un package avancé qui regroupe les processeurs, les GPU, le cache et le HMB dans un seul package. La diapositive précédente montre un package avec ce qui semble être quatre chiplets CPU/GPU couplés avec HBM. Compte tenu de l’accent mis sur le débit de calcul, si ce rendu est raisonnablement précis, nous soupçonnons qu’AMD utilisera trois chiplets GPU avec un seul chiplet CPU, mais AMD n’a pas dit d’une manière ou d’une autre.

Cela a des implications intéressantes pour les prochains projets de supercalculateurs d’AMD, car le MI300 sera probablement le moteur principal du système El Capitan. Là où Frontier utilise les processeurs Zen 3 EPYC « Trento » et relie chaque processeur 64 cœurs à quatre GPU MI250X, El Capitan peut finir par être assez différent. Utiliser un processeur Zen 4 externe puis le combiner avec quatre APU MI300 contenant chacun un processeur semble inutile. Au lieu de cela, El Capitan pourrait simplement avoir une lame 1U qui contient autant d’APU MI300 que possible.

AMD affirme que le MI300 résultant offrira une augmentation de 8 fois les performances d’entraînement de l’IA par rapport au MI250X, et encore une fois, cela revient probablement à des améliorations du débit INT8 et INT4, combinées à plus de cœurs GPU en général. Le MI250X contient une paire de matrices de calcul graphique (GCD) dans un package, et le MI300 semble avoir trois GCD CDNA 3 à côté d’une matrice CPU Zen 4. C’est 50% de potentiel graphique en plus, plus les améliorations architecturales.

Diapositives de la Journée des analystes financiers d'AMD, 9 juin 2022

(Crédit image : AMD)

AMD n’a rien révélé au-delà de CDNA 3 dans sa feuille de route, bien que CDNA 4 suive presque certainement. La feuille de route du GPU mentionnait RDNA 4, avec un délai de lancement de 2024, et CDNA 4 suivrait probablement un an plus tard. Nous laisserons AMD lancer CDNA 3 en premier, et nous attendons avec impatience d’entendre des détails supplémentaires sur la conception et l’architecture dans les mois à venir.

Source-138