Nvidia revendique Arm Grace CPU Superchip 2X plus rapide, 2,3X plus efficace que Intel Ice Lake

(Crédit image : Nvidia)

Nvidia a dévoilé sa nouvelle puce CPU Grace à 144 cœurs, sa première puce Arm uniquement CPU conçue pour le centre de données, de retour au GTC. Nvidia a partagé une référence par rapport à l’EPYC d’AMD pour revendiquer une avance de 1,5X, mais ce n’est pas une comparaison très utile. Cependant, nous avons trouvé une référence de Grace contre Ice Lake d’Intel enfouie dans une présentation GTC du vice-président de Nvidia de son unité commerciale Accelerated Computing, Ian Buck. Cette référence affirme que Grace est 2 fois plus rapide et 2,3 fois plus économe en énergie que la génération actuelle d’Ice Lake d’Intel dans un modèle de recherche et de prévision météorologiques (WRF) couramment utilisé dans le HPC.

Le premier benchmark de Nvidia a affirmé que Grace est 1,5 fois plus rapide dans le benchmark SPECrate_2017 que deux processeurs EPYC Rome 7742 à 64 cœurs de la génération précédente et qu’il offrira deux fois l’efficacité énergétique des puces de serveur d’aujourd’hui lorsqu’il arrivera au début de 2023. Cependant, ces références comparer aux puces de la génération précédente – les puces Rome auront quatre ans lorsque Grace arrivera l’année prochaine, et AMD a déjà sa livraison EPYC Milan plus rapide. Compte tenu de la comparaison avec Rome, nous pouvons nous attendre à ce que Grace de Nvidia soit à égalité avec le nouveau Milan en termes de performances et de performances par watt. Cependant, même cette comparaison n’a pas vraiment d’importance; L’EPYC Genoa d’AMD sera disponible en 2023, et il sera encore plus rapide.

Cela rend la comparaison de Nvidia avec la génération actuelle d’Ice Lake d’Intel un peu plus intéressante. Ainsi, même si Intel aura ses Sapphire Rapids disponibles d’ici 2023, au moins nous nous rapprochons d’une génération dans la comparaison ci-dessous. Naturellement, il s’agit d’un résultat de référence fourni par le fournisseur et basé sur une simulation du processeur Grace, alors prenez les affirmations de Nvidia avec un grain de sel.

Superpuce Nvidia Grace

(Crédit image : Nvidia)

Pour rappel, le Grace CPU Superchip de Nvidia est un processeur Arm v9 Neoverse (N2 Perseus) avec 144 cœurs répartis sur deux matrices fusionnées avec la nouvelle technologie d’interconnexion NVLink-C2C de Nvidia qui offre 900 Go/s de débit et de cohérence mémoire. De plus, la puce utilise 1 To de mémoire LPDDR5x ECC qui fournit jusqu’à 1 To/s de bande passante mémoire, soit le double de celle des autres processeurs de centre de données prenant en charge la mémoire DDR5.

Et ne vous y trompez pas, ce débit de mémoire amélioré joue directement sur les points forts de la superpuce Grace CPU dans le modèle de recherche et de prévision météorologique (WRF) ci-dessus. Nvidia affirme que ses simulations de la puce Grace à 144 cœurs montrent qu’elle sera 2 fois plus rapide et fournira 2,3 fois l’efficacité énergétique de deux processeurs Intel « Ice Lake » Xeon Platinum 8360Y à 36 cœurs et 72 threads dans la simulation WRF. Cela signifie que nous voyons 144 threads Arm (chacun sur un cœur physique), face à 144 threads x86 hyperthreadés (deux threads par cœur physique).

Les différentes permutations de WRF sont des charges de travail réelles couramment utilisées pour l’analyse comparative, et de nombreux modules ont été portés pour l’accélération GPU avec CUDA. Nous avons suivi Nvidia à propos de cette référence spécifique, et la société affirme que ce module n’a pas encore été porté sur les GPU, il est donc centré sur le processeur. De plus, il est très sensible à la bande passante mémoire, ce qui donne à Grace une longueur d’avance en termes de performances et d’efficacité. Les estimations de Nvidia sont « basées sur la norme NCAR WRF, version 3.9.1.1 portée sur Arm, pour le modèle IB4 (une prévision régionale de 4 km de la péninsule ibérique) ».

Source-138