Nvidia RTX 4090 Ti et Titan RTX Ada : tout ce que nous savons

Nvidia a publié son architecture Ada Lovelace en octobre 2022, en commençant par la GeForce RTX 4090, puis en poursuivant avec des variantes supplémentaires. Les prix ont augmenté par rapport à la génération précédente, certaines plus que d’autres, mais ce sont toujours certaines des meilleures cartes graphiques actuellement disponibles, la 4090 occupant la première place de notre hiérarchie de références GPU.

Mais dès le départ, nous savions que Nvidia se retenait, laissant de la place pour un potentiel RTX 4090 Ti ou un nouveau Titan RTX Ada. Voici ce que l’on sait des futurs uber-GPU de la génération Ada.

Nvidia a actuellement trois GPU Ada de bureau en production, les AD102, AD103 et AD104 qui sont utilisés respectivement dans les RTX 4090, RTX 4080 et RTX 4070 Ti. Il a également des GPU mobiles de la série RTX 40 actuellement en production qui vont du mobile RTX 4050 d’entrée de gamme au RTX 4090, qui ajoutent les puces AD106 et AD107 plus petites dans le mélange – mais notez que le mobile 4090 utilise la même puce comme le bureau 4080. Le RTX 4090 Ti et le Titan RTX Ada, selon la direction que Nvidia décide d’emprunter, atterriront naturellement au sommet de la pile et, en tant que tels, utiliseront également la puce AD102.

À l’heure actuelle, le RTX 4090, malgré toutes ses performances et sa puissance, n’utilise qu’une partie du GPU AD102 complet. C’est une grande partie, bien sûr, avec 128 des 144 multiprocesseurs de streaming (SM) possibles activés – 89% des cœurs GPU, en d’autres termes. Sauf que Nvidia a également désactivé 1 Mo de cache L2 sur chacune des douze interfaces mémoire 32 bits, ce qui lui donne 75 % du cache L2 maximum. Tout ce qu’il a à faire est d’allumer ces pièces manquantes, et peut-être même d’augmenter un peu la vitesse d’horloge et la consommation d’énergie, et nous nous retrouvons avec un nouveau RTX 4090 Ti encore plus rapide.

Et ne vous y trompez pas, Nvidia a déjà des puces AD102 entièrement fonctionnelles dans la nature. La génération professionnelle Nvidia RTX 6000 Ada, par exemple, a 142 des 144 SM activés, plus les 96 Mo de cache L2. Sauf que la consommation d’énergie est plafonnée à un « maigre » 300 W, ce qui signifie que la carte ne fonctionnera généralement pas aussi vite aussi longtemps – ce n’est pas vraiment une mauvaise approche, mais nous savons déjà qu’avec un peu plus de puissance et de tension, il est possible d’obtenir la plupart des puces Ada fonctionnent à une fréquence proche de 3,0 GHz. C’est effectivement ce qu’on attend d’une future RTX 4090 Ti et/ou Titan RTX Ada.

Balayez pour faire défiler horizontalement
Spécifications rumeurs Nvidia RTX 4090 Ti / Titan RTX et autres GPU Ada
Carte graphique Titan RTX Ada RTX 4090Ti RTX 4090 RTX 4080 RTX 4070Ti
Architecture AD102 AD102 AD102 AD103 AD104
Technologie de processus TSMC 4N TSMC 4N TSMC 4N TSMC 4N TSMC 4N
Transistors (Milliards) 76,3 76,3 76,3 45,9 35,8
Taille de matrice (mm^2) 608.4 608.4 608.4 378,6 294,5
SMS 142 142 128 76 60
Cœurs GPU (Shaders) 18176 18176 16384 9728 7680
Noyaux tenseurs 568 568 512 304 240
Cœurs RT 142 142 128 76 60
Booster l’horloge (MHz) 2520 2625 2520 2505 2610
Vitesse VRAM (Gbit/s) 24 24 21 22.4 21
VRAM (Go) 48 24 24 16 12
Largeur du bus VRAM 384 384 384 256 192
Cache L2 72 72 72 64 48
POR 192 192 176 112 80
TMU 568 568 512 304 240
TFLOPS FP32 (boost) 91,6 95,4 82,6 48,7 40.1
TFLOPS FP16 (FP8) 733 (1466) 763 (1527) 661 (1321) 390 (780) 321 (641)
Bande passante (GBps) 1152 1152 1008 717 504
TDP (watts) 800 600 450 320 285
Date de lancement ? ? octobre 2022 novembre 2022 janv. 2023
Prix ​​de lancement Bras + Jambe + Rein Bras + Jambe 1 599 $ 1 199 $ 799 $

Les spécifications actuellement supposées sont fondamentalement similaires à ce que nous voyons avec la génération RTX 6000 Ada, mais maintenant avec le double du TGP (puissance graphique totale) et une horloge de suralimentation légèrement plus élevée sur le 4090 Ti, ou même une limite de puissance de 800 W nettement plus élevée pour le Titan RTX Ada.

Les TGP plus élevés signifient bien sûr que ces cartes seraient beaucoup plus susceptibles d’atteindre les horloges de boost nominales. Et s’ils ressemblent aux autres GPU de bureau de la série RTX 40, il est plus que probable qu’ils dépasseront de loin les horloges boostées. Nos tests des cartes RTX 4090, 4080 et 4070 Ti à ce jour ont montré que les horloges de boost de jeu dans le monde réel sont souvent en moyenne plus proches de 200 MHz au-dessus de l’horloge de boost officielle.

Tout le reste découle du nombre de cœurs et de l’horloge boost. En termes de spécifications brutes, si les rumeurs sont correctes, le RTX 4090 Ti atteindra un débit maximal de 95,4 téraflops pour le travail FP32 et jusqu’à 1,5 pétaflops pour les calculs FP8 sur les cœurs Tensor. C’est 15% plus rapide que le RTX 4090 dans les deux cas.

Pour aider la carte à maintenir un débit maximal, la mémoire GDDR6X sera également augmentée jusqu’à 24 Gbps, 14% plus rapide que la mémoire de 21 Gbps utilisée avec le RTX 4090. Couplé à 33% de cache L2 en plus, le sous-système de mémoire devrait être bien équipé pour que le reste du GPU soit alimenté en données.

Les rumeurs Titan RTX Ada sont moins solides et affichent actuellement une horloge boost de 2520 MHz – la même que celle du RTX 4090. Étant donné qu’il est également censé avoir deux connecteurs d’alimentation à 16 broches et un TGP de 800 W, cependant, nous nous attendrions à une telle carte (s’il sort réellement) pour pousser des horloges encore plus élevées. Ce que nous avons vu des derniers modules GDDR6X 24 Gbps de Micron suggère que la puissance et la chaleur de la mémoire ne seront pas aussi problématiques que sur l’ancien RTX 3090, même avec des puces des deux côtés du PCB.

Cependant, il y a encore de la puissance à affronter, et même si les cartes n’atteignent pas toujours 600 W/800 W, elles sont susceptibles de pousser bien au-dessus de 500 W lors de l’exécution de jeux exigeants à 4K et avec des paramètres maximaux. Nous avons déjà vu cela se produire avec les cartes RTX 4090 que nous avons examinées une fois que nous les avons overclockées manuellement, mais le 4090 Ti / Titan Ada en fera la norme plutôt qu’un OC.

Soi-disant une image du Titan RTX Ada, via YouTuber Moore’s Law Is Dead (Crédit image : la loi de Moore est morte)

Faire face à une telle puissance nécessitera un sous-système de refroidissement exceptionnel. Nous avons généralement trouvé que le refroidissement à trois emplacements du RTX 4090 était adéquat, mais il y a des images et des fuites flottant sur le Web montrant un refroidisseur d’or à quatre emplacements. Ce sont peut-être des faux, mais la largeur supplémentaire de la fente et la coloration dorée suggèrent que nous sommes plus susceptibles que de ne pas regarder un nouveau Titan RTX Ada plutôt qu’un RTX 4090 Ti – ou peut-être que Nvidia fera les deux, bien que le 4090 Ti serait probablement avoir un refroidisseur d’argent. Il est trop tôt pour dire avec certitude comment tout se déroulera.

Les images de la carte Nvidia RTX 4090 Ti / Titan RTX Ada à 4 emplacements semblent comiquement grandes, et même si l’on considère que le RTX 4090 existant commence déjà à atteindre les limites du processeur dans de nombreux jeux en dessous de 4K (du moins si le jeu n’a pas de traçage de rayons) , cela donne vraiment l’impression que Nvidia se prépare à sauter le requin. Espérons que Nvidia fournit un support IO extra robuste (fixé en haut et en bas du refroidisseur) qui couvre les quatre emplacements pour éviter l’affaissement. Ou peut-être que Nvidia inclura simplement une béquille d’une certaine forme comme beaucoup de ses partenaires AIB ont choisi de le faire avec le RTX 4090.

Cela ne laisse que le prix et la date de sortie, dont aucun n’est encore connu. Compte tenu des fuites du refroidisseur, nous pourrions voir la nouvelle carte halo d’ici un mois ou deux, ou Nvidia pourrait tenir une fenêtre de lancement estivale ou même automnale, laissant la carte servir de rafraîchissement à mi-cycle en haut du Pile de la série RTX 40. Le lancement à la GDC (en mars) ou à la prochaine GTC (également en mars) est certainement une possibilité, en particulier si Nvidia opte pour le marché cible « prosommateur et créateur » avec un nouveau Titan RTX Ada, et il pourrait contenir le RTX 4090 Ti pour une date ultérieure.

Le prix sera naturellement ridicule. Tout espoir d’une future carte RTX 4090 Ti ou Titan RTX Ada à un prix raisonnable a pratiquement disparu lorsque les cartes RTX 4090 ont été régulièrement vendues ou à un prix supérieur à 2 000 $ pendant les trois premiers mois après le lancement. Nous soupçonnons toujours que cela provenait en grande partie d’utilisateurs professionnels qui étaient prêts à payer plus pour des performances optimales en matière d’IA et d’autres charges de travail de calcul, et un 4090 Ti ou Titan RTX Ada répondrait à ces mêmes utilisateurs.

Si Nvidia opte pour la marque GeForce RTX 4090 Ti, le prix sera probablement fixé à 1 999 $. Pour un nouveau Titan RTX Ada, 2 499 $ ou même 2 999 $ semblent probables. Un Titan offrirait la plupart de ce que le RTX 6000 Ada fournit déjà (en fonction de la capacité de la VRAM), plus des horloges plus élevées grâce à l’augmentation du TGP, et trois mille seraient toujours moins de la moitié du prix du véritable GPU professionnel. Ceux qui ne sont intéressés que par le droit de se vanter à tout prix semblent également disposer de fonds suffisants pour payer tout ce que Nvidia demande.

GeForce RTX 3060Ti

(Crédit image : Nvidia)

Le reste d’entre nous peut s’en tenir à des GPU plus raisonnables, comme un remplacement du RTX 3060 Ti – ou simplement attendre l’inévitable série RTX 50, qui arrivera probablement fin 2024. Parce que s’il y a une chose que nous savons avec certitude, c’est que peu importe la vitesse à laquelle les futurs RTX 4090 Ti et/ou Titan RTX Ada finiront par être, à un moment donné, Nvidia publiera un RTX 5080 et un RTX 5090 (ou un autre nom, peut-être) qui offriront des performances encore plus élevées que ce que le plus rapide La carte graphique Ada Lovelace peut espérer livrer.

Si nous avons de la chance, peut-être que le ralentissement actuel des ventes de GPU et de PC entraînera même une tarification plus agressive pour un changement. Cela s’est produit, en théorie du moins, avec le RTX 3080 en 2020. C’est dommage que l’extraction de crypto-monnaie et la pandémie aient fini par ruiner les prix pour les deux prochaines années et influencer le cycle actuel de prix plus élevés.

Nous avons au moins un nom de code pour le successeur d’Ada : Blackwell, vraisemblablement d’après David Harold Blackwell, un mathématicien et statisticien spécialisé dans la théorie des jeux et la théorie de l’information. Sauf que nous ne savons pas avec certitude si Blackwell est uniquement un futur remplaçant de Hopper (pour le marché des centres de données), ou s’il couvrira à la fois les marchés des centres de données et des consommateurs, comme Ampere. Considérant qu’Ada Lovelace n’a que quelques mois, viser Blackwell à ce stade semble un peu prématuré.

Source-138