Nvidia révèle les secrets du GPU d’Ada Lovelace : le nombre de transistors extrêmes à des horloges élevées

Lorsque Nvidia a présenté sa famille d’unités de traitement graphique Ada Lovelace plus tôt cette semaine, elle s’est principalement concentrée sur son GPU AD102 haut de gamme et sa carte graphique phare GeForce RTX 4090. Il n’a pas dévoilé trop de détails sur ses puces graphiques AD103 et AD104. Heureusement, Nvidia a mis en ligne aujourd’hui son livre blanc Ada Lovelace qui contient de nombreuses données sur les nouveaux GPU et comble de nombreuses lacunes. Nous avons mis à jour les GPU de la série RTX 40 tout ce que nous savons hub avec les nouveaux détails, mais voici l’aperçu des informations nouvelles et intéressantes.

Gros GPU pour gros jeux

Nous savons déjà que l’AD102 haut de gamme de Nvidia est un GPU de 608 mm ^ 2 contenant 76,3 milliards de transistors, 18 432 cœurs CUDA et 96 Mo de cache L2. Nous savons également que l’AD103 est un processeur graphique de 378,6 mm^2 avec 45,9 milliards de transistors, 10 240 cœurs CUDA et 64 Mo de cache L2. Quant à l’AD104, il a une taille de matrice de 294,5 mm ^ 2, 35,8 milliards de transistors, 7680 cœurs CUDA et 48 Mo de L2.

Spécifications Nvidia Ada contre Ampère
GPU/carte graphique AD102 complet RTX 4090 RTX 4080 16 Go RTX 4080 12 Go RTX 3090Ti
Architecture AD102 AD102 AD103 AD104 GA102
Technologie de processus TSMC 4N TSMC 4N TSMC 4N TSMC 4N Samsung 8LPP
Transistors (Milliards) 76,3 76,3 45,9 35,8 28.3
Taille de matrice (mm^2) 608 608 378,6 294,5 628.4
Multiprocesseurs de diffusion en continu 144 128 76 60 84
Cœurs GPU (Shaders) 18432 16384 9728 7680 10752
Noyaux tenseurs 576 512 320 240 336
Cœurs de traçage de rayons 144 144 80 60 84
TMU 512 512 304 ? 240 336
POR 192 192 112 80 112
Cache L2 (Mo) 96 96 64 48 6
Booster l’horloge (MHz) ? 2520 2505 2600 1860
TFLOPS FP32 (boost) ? 82,6 48,7 40.1 40,0
TFLOPS FP16 (FP8) ? 661 (1321) 390 (780) 319 (639) 320 (N/A)
Traçage de rayons TFLOPS ? 191 113 82 78.1
Interface mémoire (bit) 384 384 256 192 384
Vitesse de la mémoire (GT/s) ? 21 22.4 21 21
Bande passante (GBps) ? 1008 736 504 1008
TDP (watts) ? 450 320 285 450
Date de lancement ? 12 octobre 2022 novembre 2022 ? novembre 2022 ? mars 2022
Prix ​​de lancement ? 1 599 $ 1 199 $ 899 $ 1 999 $

L’une des choses intéressantes que Nvidia raconte dans son livre blanc est que les GPU Ada Lovelace utilisent des transistors à haute vitesse dans les chemins critiques pour augmenter les vitesses d’horloge maximales. En conséquence, son GPU AD102 entièrement activé avec 18 432 cœurs CUDA est « capable de fonctionner à des horloges supérieures à 2,5 GHz, tout en conservant le même TGP de 450 W ». Gardant cela à l’esprit, nous ne sommes pas surpris que la société parle d’horloges à 3,0 GHz pour la GeForce RTX 4090 (avec 16 384 cœurs CUDA) atteintes dans ses laboratoires. À 3,0 GHz, la GeForce RTX 4090 sera absolument la tête d’affiche de notre liste des meilleures cartes graphiques du marché.

(Crédit image : Nvidia)

En plus des horloges élevées, le GPU Ada Lovelace de Nvidia dispose également d’énormes caches L2 qui améliorent les performances dans les charges de travail intensives en calcul (par exemple, le traçage de rayons, le traçage de chemin, les simulations, etc.) et réduisent les besoins en bande passante mémoire. Essentiellement, les GPU Ada de Nvidia s’inspirent ici du livre de RDNA 2 Infinity Cache, bien que nous pensons que les objectifs généraux de la nouvelle architecture ont été définis bien avant le lancement des produits de la série Radeon RX 6000 d’AMD en 2020.

Source-138