Les exigences de performances toujours croissantes des centres de données cloud obligent les développeurs de processeurs à repenser leurs conceptions dans le but d’offrir des performances maximales par socket tout en faisant face aux contraintes de coût définies par le ralentissement de la loi de Moore. L’EPYC ‘Begamo’ d’AMD est le premier processeur natif cloud x86 de l’industrie basé sur la microarchitecture Zen 4c spécialement adaptée qui conserve essentiellement le même ensemble de fonctionnalités avec la microarchitecture Zen 4 tout en réduisant de moitié les exigences de taille de cœur, rapporte SemiAnalysis.
Le processeur EPYC ‘Bergamo’ d’AMD contient 128 cœurs et se trouve dans le même Socket SP5 que le processeur EPYC ‘Genoa’ à 96 cœurs et dispose d’un sous-système de mémoire DDR5-4800 à 12 canaux similaire et utilise la même matrice d’E/S (nom de code Floyd), ce qui signifie qu’il possède également 128 voies PCIe Gen5 et d’autres particularités des produits SP5. Étant un système sur puce (SoC) natif du cloud – et, dans une certaine mesure, une réponse aux nouveaux SoC de qualité centre de données basés sur Arm d’Ampere, Amazon, Google et Microsoft – la conception de Bergame a été façonnée par plusieurs facteurs, notamment efficacité, consommation d’énergie, taille de matrice et faible coût total de possession (TCO) plutôt que par l’objectif de fournir les performances maximales par cœur.
Ligne 0 – Cellule 0 | EPYC 9654 | EPYC 9754 | EPYC 9734 |
Conception | Gênes | Bergame | Bergame |
Microarchitecture | Zen 4/Perséphone | Zen 4c/Dionysos | Zen 4c/Dionysos |
Cœurs/Threads | 96/192 | 128/256 | 112/224 |
Cache L1i | 32 Ko | 32 Ko | 32 Ko |
Cache L1d | 32 Ko | 32 Ko | 32 Ko |
Cache L2 | 1 Mo | 1 Mo | 1 Mo |
Cache L2 total | 96 Mo | 128 Mo | 112 Mo |
Cache L3 par CCX | 32 Mo | 16 Mo | 16 Mo |
Cache L3 total | 384 Mo | 256 Mo | 256 Mo |
CCD | Durango | Vindhya | Vindhya |
Nombre de CCD | 12 | 8 | 8 |
CCX par CCD | 1 | 2 | 2 |
Cœurs par CCD | 8 | 16 | 14 |
Matrice d’E/S | Floyd | Floyd | Floyd |
Canaux mémoire | 12 | 12 | 12 |
Vitesse de mémoire nominale | DDR5-4800 | DDR5-4800 | DDR5-4800 |
Bande passante mémoire | 460,8 Go/s | 460,8 Go/s | 460,8 Go/s |
Voies PCIe 5.0 | 128 | 128 | 128 |
TDP/TDP maximum | 360W/400W | 360W/400W | 360W/400W |
Prise | SP5 | SP5 | SP5 |
Évolutivité | 2P | 2P | 2P |
Au niveau de la microarchitecture, Zen 4c conserve la même conception que Zen 4, y compris des fonctionnalités et des performances d’instructions par horloge identiques, mais ils sont configurés et implémentés d’une manière radicalement différente, affirme SemiAnalysis. En ce qui concerne les cœurs Zen 4c « Dionysus », ils sont environ 35,4 % plus petits que les cœurs Zen 4 « Persephone », selon SemiAnalysis. Pour y parvenir, AMD a dû mettre en œuvre un certain nombre d’astuces de conception. Les analystes estiment :
- Il a réduit les cibles d’horloge boost de 3,70 GHz à 3,10 GHz. Cela a simplifié la fermeture de la synchronisation et réduit le besoin de cellules tampons supplémentaires pour répondre aux contraintes de synchronisation assouplies. Les conceptions d’aujourd’hui sont souvent limitées par la densité de routage et la congestion, de sorte que la réduction de la fréquence permet un regroupement plus serré des voies de signal, améliorant ainsi la densité des cellules standard.
- Il a réduit le nombre de partitions physiques d’un dé et a rapproché la logique, ce qui a rendu le débogage et l’introduction de correctifs plus difficiles, mais a réduit la taille du dé.
- Il a utilisé des cellules SRAM à double port 6T plus denses pour Zen 4c par opposition aux circuits SRAM à double port 8T pour Zen 4 afin de réduire la zone SRAM. En conséquence, alors que les cœurs Zen 4 et Zen 4c ont des tailles de cache L1 et L2 similaires, la zone utilisée par les caches dans le cas de Zen 4c est inférieure, mais ces caches ne sont pas aussi rapides que ceux de Zen 4.
- Enfin, il a supprimé les réseaux de vias traversant le silicium (TSV) pour le V-Cache 3D, afin d’économiser davantage le silicium.
Ce n’étaient pas les seules méthodes de réduction de surface de matrice utilisées par AMD. Selon SemiAnalysis, le Bergame d’AMD est basé sur huit matrices complexes de base Vindhya (CCD) qui contiennent 16 cœurs Zen 4c (contre huit cœurs Zen 4 par CCD) – ce qui est justifié car les cœurs sont devenus plus petits, mais qui a également un impact sur le potentiel de vitesse d’horloge. Chaque CCD comprend également deux complexes de cœur à huit cœurs (CCX) et 32 Mo de cache L3, soit 16 Mo par CCX. En revanche, chaque Zen 4 CCX dispose de 32 Mo de L2, ce qui augmente considérablement sa taille par rapport au Zen 4c CCX.
Dans l’ensemble, nous pourrions dire que le Zen 4c et le Bergame d’AMD modifient la trajectoire de conception, car la société devait intégrer 128 cœurs de classe Zen 4 dans la même enveloppe de puissance de 360 W à 400 W que Genoa. Des objectifs de fréquence réduits, l’utilisation de cellules SRAM plus denses et la réduction de moitié de L3 par CCX ont certainement permis à AMD d’augmenter son nombre de cœurs, mais nous devrons encore découvrir comment cela a affecté les performances par cœur.
SemiAnalysis indique qu’AMD se prépare à lancer deux processeurs Bergame plus tard ce mois-ci : l’EPYC 9754 à 128 cœurs et son frère légèrement réduit, l’EPYC 9734 à 112 cœurs. Étant donné que les opérateurs de centres de données exascale ont tendance à avoir des exigences spécifiques pour leurs déploiements , nous ne pouvons que nous demander combien d’offres Bergame personnalisées et semi-personnalisées AMD produira éventuellement, mais pour l’instant, deux modèles devraient être introduits dès la semaine prochaine.
« Vous allez en entendre parler la semaine prochaine avec Bergamo, qui est un appareil optimisé pour le cloud avec une haute densité et de très bonnes performances par watt en termes d’efficacité énergétique pour l’informatique cloud native », a déclaré Dan McNamara, l’activité serveurs d’AMD. chef, à la Bank of America 2023 Global Technology Conference (via SeekingAlpha).