Le PDG de Nvidia commente le retard du processeur de Grace et taquine l’échantillonnage du silicium

Nvidia a taquiné son prochain processeur Grace basé sur Arm au GTC 2023, mais l’annonce de la société selon laquelle les systèmes seront désormais livrés au cours du second semestre de cette année représente un retard par rapport à son calendrier de lancement initial qui visait le premier semestre 2023. Nous avons demandé au PDG de Nvidia, Jensen Huang à propos du retard lors d’une séance de questions-réponses avec la presse aujourd’hui, que nous aborderons ci-dessous. Nvidia a également montré son silicium Grace pour la première fois et a fait de nombreuses nouvelles revendications de performances lors de son discours d’ouverture GTC, notamment que ses puces Grace basées sur Arm sont jusqu’à 1,3 fois plus rapides que les concurrents x86 à 60% de la puissance, ce que nous allons couvrir également.

J’ai interrogé Jensen Huang sur le retard dans la livraison des systèmes Grace CPU et Grace Hopper Superchip au marché final. Après avoir repoussé de manière ludique la date de sortie prévue (il était sans doute 1H23, maintenant 2H23), il a répondu :

« Eh bien, tout d’abord, je peux vous dire que Grace et Grace Hopper sont toutes les deux en production, et que le silicium vole à travers l’usine maintenant. Des systèmes sont en cours de fabrication, et nous avons fait beaucoup d’annonces. Les équipementiers et les fabricants d’ordinateurs du monde entier les construisent. . » Huang a également fait remarquer que Nvidia ne travaille sur les puces que depuis deux ans, ce qui est relativement court compte tenu du cycle de conception typique de plusieurs années pour une puce moderne.

La définition actuelle des systèmes d’expédition peut être floue – les premiers systèmes d’AMD et d’Intel sont souvent livrés à des hyperscalers pour un déploiement bien avant que les puces ne soient disponibles sur étagère. Cependant, alors que Nvidia dit qu’il échantillonne des puces aux clients, il n’a pas encore dit que Grace était déployée en production. En tant que telles, les puces sont en retard selon les projections de la société, mais pour être juste, les lancements de puces toujours en retard par des sociétés comme Intel ne sont pas rares. Cela met en évidence la difficulté de lancer une nouvelle puce, même en construisant autour des puces x86 dominantes avec des plates-formes matérielles et logicielles établies depuis des décennies.

En revanche, les puces Grace et Grace + Hopper de Nvidia repensent de fond en comble de nombreux aspects fondamentaux de la conception des puces avec une nouvelle interconnexion puce à puce innovante. L’utilisation par Nvidia du jeu d’instructions Arm signifie également qu’il y a un poids plus lourd pour les optimisations et le portage des logiciels, et la société a une toute nouvelle plate-forme à construire.

Jensen a fait allusion à une partie de cela dans sa réponse détaillée, en disant : « Nous avons commencé avec des Superchips au lieu de chiplets parce que les choses que nous voulons construire sont si grandes, et les deux sont en production aujourd’hui. Donc, les clients sont échantillonnés, le logiciel est en cours de portage, et nous faisons beaucoup de tests. Pendant la keynote, j’ai montré quelques chiffres, et je ne voulais pas alourdir la keynote avec beaucoup de chiffres, mais tout un tas de chiffres seront disponibles pour que les gens puissent en profiter. Mais la performance était vraiment formidable.

Et les affirmations de Nvidia sont impressionnantes. Par exemple, dans l’album ci-dessus, vous pouvez voir la puce Grace Hopper que Nvidia a montrée en chair et en os pour la première fois au GTC (plus de détails techniques ici).

Au cours de la présentation, Huang a affirmé que les puces sont 1,2 fois plus rapides que la puce de serveur x86 de nouvelle génération « moyenne » dans un benchmark gourmand en mémoire HiBench Apache Spark et 1,3 fois plus rapides dans un benchmark de communication de microservices Google, tout en ne tirant que 60 % de la puissance.

Nvidia affirme que cela permet aux centres de données de déployer 1,7 fois plus de serveurs Grace dans des tranches à puissance limitée, chacune offrant un débit 25 % plus élevé. La société affirme également que Grace est 1,9 fois plus rapide dans les charges de travail de dynamique des fluides computationnelle (CFD).

Source-138