Selon les rumeurs, le premier APU exascale d’AMD serait Instinct MI300 : alimenté par des cœurs de processeur Zen 4 et des cœurs GPU CDNA 3 pour des performances HPC rapides et époustouflantes

AMD semble également travailler sur son produit APU Exascale de première génération, l’Instinct MI300, alimenté par les cœurs Zen 4 CPU et CDNA 3 GPU. Les détails de cette puce HPC ont également été divulgués dans la dernière vidéo d’AdoredTV.

AMD Instinct MI300 sera le premier produit APU exascale de Red Team avec processeur Zen 4, cœurs GPU CDNA 3 et mémoire HBM3

Les premières références à l’APU Exascale d’AMD remontent à 2013 et d’autres éléments seront révélés au cours de l’année à venir. En 2015, la société a révélé son intention d’offrir l’EHP, un processeur hétérogène exascale, basé sur les cœurs Zen x86 et le GPU Groenland avec mémoire HBM2 sur un interposeur 2.5D. Les plans originaux ont finalement été abandonnés et AMD a ensuite publié sa gamme EPYC et Instinct dans leurs propres segments de serveurs CPU et GPU. Maintenant, AMD ramène les APU EHP ou Exascale sous la forme de l’Instinct MI300 de nouvelle génération.

Fuite de la feuille de route du serveur AMD EPYC : EPYC Genoa-X avec Zen 4 et 3D-V-Cache en 1H 2023, Gênes, Bergame et Turin avec prise en charge SP6

Le premier APU Exascale d’AMD, l’Instinct MI300, a été divulgué et détaillé. (Crédits image : AdoredTV)

Une fois de plus, l’APU AMD Exascale formera une harmonie entre les IP CPU et GPU de l’entreprise, combinant les derniers cœurs de processeur Zen 4 avec les derniers cœurs de GPU CDNA 3. On dit qu’il s’agit de l’APU Exascale & Instinct de première génération. Dans la diapositive publiée par AdoredTV, il est mentionné que l’APU sera enregistré d’ici la fin de ce mois, ce qui signifie que nous pouvons voir un lancement potentiel en 2023, au même moment où la société devrait dévoiler son architecture GPU CDNA 3 pour le Segments HPC.

Le premier silicium devrait être dans les laboratoires d’AMD d’ici le troisième trimestre 2022. La plate-forme elle-même est considérée comme MDC, ce qui pourrait signifier Multi-Die Chip. Dans un rapport précédent, il a été déclaré que l’APU comportera un nouveau « mode APU Exascale » et une prise en charge des fonctionnalités sur le socket SH5 qui sera probablement disponible dans le facteur de forme BGA.

Outre les adresses IP CPU et GPU, un autre pilote clé derrière l’APU Instinct MI300 serait sa prise en charge de la mémoire HBM3. Bien que nous ne soyons toujours pas sûrs du nombre exact de matrices présentées sur l’APU EHP, Moore’s Law is Dead a précédemment révélé des configurations de matrices avec 2, 4 et 8 matrices HBM3. Le tir de matrice est montré dans la diapositive de la dernière fuite et montre également au moins 6 matrices qui devraient être une toute nouvelle configuration. Il est possible que plusieurs configurations Instinct MI300 soient en cours d’élaboration, certaines ne comportant que les puces GPU CDNA 3 et les conceptions APU avec les IP Zen 4 et CDNA3.

Il semble donc que nous allons certainement voir les APU Exascale en action après presque une décennie d’attente. L’Instinct MI300 vise définitivement à révolutionner l’espace HPC avec des performances insensées jamais vues auparavant et avec des technologies de base et d’emballage qui vont être une révolution pour l’industrie technologique. La puce sera en concurrence avec les accélérateurs Grace+Hopper Super Chip de NVIDIA et Ponte Vecchio HPC d’Intel l’année prochaine.

Accélérateurs AMD Radeon Instinct 2020

Nom de l’accélérateur AMD Instinct MI300 AMD Instinct MI250X AMD Instinct MI250 AMD Instinct MI210 AMD Instinct MI100 AMD Radeon Instinct MI60 AMD Radeon Instinct MI50 AMD Radeon Instinct MI25 AMD Radeon Instinct MI8 AMD Radeon Instinct MI6
Architecture du processeur Zen 4 (APU exascale) N / A N / A N / A N / A N / A N / A N / A N / A N / A
Architecture GPU À déterminer (ADNC 3) Aldébaran (CDNA 2) Aldébaran (CDNA 2) Aldébaran (CDNA 2) Arcturus (ADNC 1) Véga 20 Véga 20 Véga 10 Fidji XT Polaris 10
Nœud de processus GPU 5 nm + 6 nm 6nm 6nm 6nm FinFET 7 nm FinFET 7 nm FinFET 7 nm FinFET 14nm 28nm FinFET 14nm
Chiplets GPU 4 (MCM / 3D empilé)
1 (par dé)
2 (MCM)
1 (par dé)
2 (MCM)
1 (par dé)
2 (MCM)
1 (par dé)
1 (monolithique) 1 (monolithique) 1 (monolithique) 1 (monolithique) 1 (monolithique) 1 (monolithique)
Cœurs GPU 28 160 ? 14 080 13 312 6656 7680 4096 3840 4096 4096 2304
Vitesse d’horloge du processeur graphique À déterminer 1700 MHz 1700 MHz 1700 MHz 1500 MHz 1800 MHz 1725 MHz 1500 MHz 1000 MHz 1237 MHz
FP16 Calcul À déterminer 383 TOP 362 TOP 181 TOP 185 TFLOP 29,5 TFLOP 26,5 TFLOP 24.6 TFLOP 8.2 TFLOP 5.7 TFLOP
Calcul FP32 À déterminer 95,7 TFLOP 90,5 TFLOP 45.3 TFLOP 23.1 TFLOP 14.7 TFLOP 13.3 TFLOP 12.3 TFLOP 8.2 TFLOP 5.7 TFLOP
Calcul FP64 À déterminer 47.9 TFLOP 45.3 TFLOP 22.6 TFLOP 11.5 TFLOP 7.4 TFLOP 6.6 TFLOP 768 GFLOP 512 GFLOP 384 GFLOP
VRAM 192 Go HBM3 ? 128 Go HBM2e 128 Go HBM2e 64 Go HBM2e 32 Go HBM2 32 Go HBM2 16 Go HBM2 16 Go HBM2 4 Go HBM1 16 Go GDDR5
Horloge mémoire À déterminer 3,2 Gbit/s 3,2 Gbit/s 3,2 Gbit/s 1200 MHz 1000 MHz 1000 MHz 945 MHz 500 MHz 1750 MHz
Bus mémoire 8192 bits 8192 bits 8192 bits 4096 bits Bus 4096 bits Bus 4096 bits Bus 4096 bits Bus 2048 bits Bus 4096 bits Bus 256 bits
Bande passante mémoire À déterminer 3,2 To/s 3,2 To/s 1,6 To/s 1,23 To/s 1 To/s 1 To/s 484 Go/s 512 Go/s 224 Go/s
Facteur de forme OAM OAM OAM Carte à double emplacement Double fente, pleine longueur Double fente, pleine longueur Double fente, pleine longueur Double fente, pleine longueur Double fente, demi-longueur Fente unique, pleine longueur
Refroidissement Refroidissement passif Refroidissement passif Refroidissement passif Refroidissement passif Refroidissement passif Refroidissement passif Refroidissement passif Refroidissement passif Refroidissement passif Refroidissement passif
PDT ~600W 560W 500W 300W 300W 300W 300W 300W 175W 150W

Source-123