Un leaker du nom de @davideneco25320 sur Twitter a partagé quelques détails très précis sur les GPU Ada (alias Lovelace) de nouvelle génération de Nvidia, y compris le nombre de SM et les noms de chaque nouveau dé. Si ses données sont exactes (et compte tenu du récent piratage de Nvidia, cela pourrait très bien l’être), Ada constituera une mise à niveau massive par rapport à Ampere, la série RTX 30, en particulier pour le GPU phare. Comme il s’agit de données divulguées et qu’on ne peut pas leur faire entièrement confiance, prenez ces résultats avec un grain de sel.
La fuite montre que Nvidia ne changera pas sa nomenclature pour la génération Ada, conservant le préfixe à deux lettres et le système de numérotation à trois chiffres comme génération Ampère. AD102 désigne le GPU phare, probablement pour une carte RTX 3090 ou de classe Titan, avec AD103 suivant comme le prochain dé le plus puissant (peut-être pour un potentiel RTX 4080). AD104-106 emboîtera le pas étant les matrices de milieu de gamme (c’est-à-dire RTX 4070 et RTX 4060) et AD107 remplira le marché d’entrée de gamme pour les GPU Ada de Nvidia (c’est-à-dire quelque chose comme un RTX 4050).
Notez également que les noms de code suggèrent que Nvidia utilisera le nom de code Ada et non le nom de code Lovelace précédemment répandu, c’est ainsi que nous nous référerons aux futurs GPU pour l’instant.
Une chose qui a considérablement changé est le nombre de SM à Ada. Le dé phare AD102 est censé faire pencher la balance avec 144 SM dans un seul dé. À titre de comparaison, le GA102 d’Ampere n’a que 84 SM, ce qui représente une augmentation de 71 % du nombre de SM, qui devrait également s’appliquer aux cœurs GPU, aux cœurs RT, aux TMU et à d’autres éléments. Ce sera l’un des plus grands sauts que nous ayons jamais vus en une seule génération.
Si Nvidia maintient le même nombre de cœurs CUDA sur Ada, cela signifie que nous pourrions envisager 18 432 cœurs CUDA pour la carte phare. Le prochain RTX 3090 TI de Nvidia n’a « que » 10 752 cœurs CUDA, utilisant la puce GA102 complète. Bien sûr, nous verrons également des variantes moins importantes qui utilisent des puces AD102 partiellement récoltées, et bien que 144 SM puissent être le maximum, nous ne serions pas surpris de voir 10 à 20 % des SM désactivés pour certains modèles de cartes graphiques.
Le nombre de SM dans les autres puces n’est pas aussi élevé, bien que les chiffres soient toujours très respectables. AD103 aura soi-disant les mêmes 84 SM que GA102 avec 84 SM, un saut de 40% par rapport à GA103. AD104 suivra, avec les mêmes 60 SM que GA103, soit 25% de SM en plus que GA104. AD106 est un peu plus proche de GA106, avec 36 SM – une augmentation de 20 %. Enfin, l’AD107 ne comportera que 24 SM, encore une fois le même bond respectable de 20% du nombre de SM par rapport au GA107.
Si ces fuites et rumeurs s’avèrent exactes, nous pouvons nous attendre à ce que des cartes phares comme les futurs RTX 4090 et RTX 4080 offrent des améliorations de performances incroyables par rapport à la série RTX 30 actuelle. C’est certainement un saut plus important qu’Ampère par rapport à Turing, du moins à certains égards. Le RTX 3080, par exemple, avait 68 SM par rapport aux 68 SM du RTX 2080 Ti, bien qu’il y ait eu beaucoup d’autres changements.
Ce qui précède ne tient pas compte des améliorations de performances supplémentaires provenant de l’architecture Ada elle-même, ce qui pourrait apporter d’autres avantages. La rumeur court depuis un certain temps qu’Ada reviendra de Samsung à TSMC avec son dernier nœud N5 5 nm. Cela seul devrait apporter des améliorations significatives en termes d’efficacité et de nombre de transistors sur Ampère, et peut également débloquer des vitesses d’horloge plus élevées.
La consommation électrique pourrait également être augmentée pour les GPU Ada avec l’ajout des nouveaux connecteurs d’alimentation à 16 broches qui sont actuellement développés et produits pour les futures cartes graphiques PCIe 5.0. Doté d’une puissance de sortie maximale de 600 W à partir d’une seule prise, cela donnerait à Nvidia une tonne de marge pour améliorer les performances sur les GPU Ada.
Ada peut également être la première solution graphique compatible PCIe 5.0, et bien que l’augmentation de la bande passante PCIe n’ait pas trop d’importance, cela ne nuira certainement pas aux performances. Ce que nous ne savons pas, c’est à quel point Nvidia envisage de modifier les éléments fondamentaux d’Ada. Par exemple, Turing avait 64 cœurs FP32 et 64 cœurs INT32 par SM, qui pouvaient s’exécuter simultanément sur différentes données. Ampère a modifié les choses pour que les cœurs INT32 deviennent INT32 ou Cœurs FP32, doublant potentiellement les performances du FP32.
Ampere comprend également des cœurs Tensor de 3e génération et des cœurs RT de 2e génération pour le lancer de rayons. Ada utilisera probablement des cœurs Tensor de 4e génération et des cœurs RT de 3e génération. Qu’est-ce que cela signifiera ? Nous n’avons pas de détails exacts, mais Ada offrira presque certainement beaucoup plus de performances que les GPU Ampère actuels. Il peut y avoir plus de cœurs CUDA, Tensor et/ou RT par SM, ou les pipelines internes peuvent simplement être réorganisés pour améliorer le débit.
La mémoire est également un autre acteur important en matière de performances GPU et pourrait jouer un rôle encore plus important dans l’amélioration des fréquences d’images compte tenu du nombre de SM qu’Ada peut avoir. GDDR6 + et GDDR7 sont déjà sur la feuille de route de Samsung avec des améliorations substantielles de la bande passante par rapport à GDDR6X, et Nvidia utilisera probablement l’une ou les deux de ces nouvelles normes si elles sont prêtes à temps pour la production Ada. Après tout, plus vous avez de cœurs, plus vous avez besoin de bande passante mémoire pour tous les alimenter.
D’une manière générale, Nvidia a amélioré les performances de ses GPU les plus rapides d’environ 30 % avec les architectures précédentes, mais avec le changement de nœud de processus et l’augmentation massive du nombre de cœurs, ainsi qu’une limite de puissance potentiellement plus élevée, il n’est pas irréaliste d’attendre des améliorations encore plus importantes d’Ada.
Le RTX 4090 (ou quel que soit son nom) finira-t-il par offrir deux fois les performances du RTX 3090 ? C’est ambitieux mais certainement pas hors de portée. 75 % de cœurs en plus avec des vitesses d’horloge plus élevées et/ou une architecture plus efficace feraient l’affaire. Nous en saurons plus plus tard cette année, car Ada devrait être lancé en septembre.