La GeForce RTX 4090 de Nvidia peut sembler incroyablement puissante et se classera certainement comme l’option la plus rapide de notre liste des meilleures cartes graphiques lors de ses débuts (au moins jusqu’à l’arrivée des GPU RDNA 3 d’AMD), mais la matrice AD102 rasée du RTX 4090 n’est Ce n’est pas près de montrer tout le potentiel d’AD102 avec tous ses cœurs et son cache activés. Ceci, combiné à des améliorations supplémentaires, pourrait faire allusion à un futur RTX 4090 Ti qui sera beaucoup plus rapide – et peut-être même plus cher.
Les spécifications des GPU Nvidia RTX série 40 et Ada Lovelace, mais celles-ci ne montrent que les cartes annoncées et supposées. La matrice AD102 complète de Nvidia est équipée de 144 SM, de 18 432 cœurs CUDA, de 96 Mo de cache L2 et de 192 ROP. Cela se traduit par 12 % de cœurs CUDA en plus et 33 % de capacité de cache L2 en plus par rapport au RTX 4090 que nous avons aujourd’hui. La matrice AD102 entièrement activée contient également 9 % de ROPS en plus et 12 % d’unités de mappage de texture en plus, grâce aux SM supplémentaires.
Mais ce n’est pas tout ce qui pouvait être fait pour la future 4090 Ti. Micron a de nouveaux modules de mémoire 24 Gbps GDDR6X en préparation, une augmentation supplémentaire de 14% par rapport aux modules 21 Gbps du RTX 4090, et toujours plus rapide que les modules 22,4 Gbps du RTX 4080 16 Go qui, selon Nvidia, sont les plus rapides au monde en ce moment. Cela pousserait l’hypothétique (mais très probable) RTX 4090 Ti jusqu’à 1152 Mo/s de bande passante.
Mais une mémoire plus rapide entraînerait une consommation d’énergie plus élevée, et nous soupçonnons que Nvidia freine également sérieusement la vitesse d’horloge complète et le potentiel de puissance de l’AD102. Toutes ces rumeurs de cartes graphiques 600W RTX série 40 ? Nous savons que Nvidia a overclocké avec succès le RTX 4090 à plus de 3,0 GHz, ce qui augmenterait certainement la consommation d’énergie.
Il semble que l’architecture Ada et le processus 4N de TSMC aient encore beaucoup de marge au-delà de la fréquence de suralimentation de 2520 MHz du RTX 4090. Une fois que le processus mûrit un peu plus, et si Nvidia est prêt à augmenter les limites de puissance, nous ne serions pas surpris de voir une horloge RTX 4090 Ti à plus près de 2800 MHz.
Les performances théoriques de l’AD102 avec toutes ces cloches et sifflets activés pourraient atteindre 103 téraflops dans les charges de travail FP32, et 826 téraflops dans les charges de travail FP16 avec les cœurs Tensor et 1652 téraflops avec les cœurs Tensor en mode FP8. Ce serait un énorme saut de performance de 25% par rapport au RTX 4090.
Ces gains ne seraient bien sûr réalisés que dans des scénarios limités par le GPU, donc probablement pas en 1080p ou 1440p. Les applications de calcul lourdes en bénéficieraient également probablement. La combinaison d’une plus grande capacité de cache L2, d’une bande passante GDDR6X supplémentaire et d’un plus grand nombre de cœurs et d’horloges pourrait entraîner des améliorations tangibles.
RTX 4090 Ti (AD102 complet) | RTX 4090 | RTX 3090Ti | |
Traiter | TSMC 4N | TSMC 4N | Samsung 8N |
Transistors | 76.3B | 76.3B | 28.3 |
SMS | 144 | 128 | 84 |
Cœurs GPU | 18432 | 16384 | 10752 |
Noyaux tenseurs | 576 | 512 | 336 |
Cœurs de traçage de rayons | 144 | 128 | 84 |
Booster l’horloge | 2800MHz ??? | 2520MHz | 1860MHz |
Vitesse VRAM | 24 Gbit/s ? | 21 Gbit/s | 21 Gbit/s |
VRAM | 24 Go | 24 Go | 24 Go |
Largeur du bus | 384 | 384 | 384 |
Bande passante mémoire | 1152 Go/s | 1008 Go/s | 1008 Go/s |
Capacité du cache L2 | 96 Mo | 72 Mo | Aucun |
POR | 192 | 176 | 112 |
TMU | 576 | 512 | 336 |
TFLOPS FP32 | 103.2 | 82,6 | 40 |
TFLOPS FP16 | 826 | 661 | N / A |
PDT | 600W ?? | 450W | 450W |
Quand verrons-nous un RTX 3090 Ti ?
Il semble que Nvidia ait encore beaucoup de marge de performance avec sa matrice GA102, avec le potentiel de créer un RTX 4090 Ti qui pourrait théoriquement fumer le RTX 4090. Cela coûterait certainement beaucoup plus cher et consommerait beaucoup plus d’énergie qu’un RTX 4090 , Mais cela peut être fait.
Tout cela dépendra de la force avec laquelle Nvidia veut pousser sa matrice GA102, et cela dépendra presque certainement de la proximité d’AMD pour faire correspondre les performances de Nvidia avec les prochaines puces RDNA 3. Les rendements sur les GPU AD102 entièrement fonctionnels joueraient également un rôle, bien qu’il soit peu probable qu’il s’agisse de pièces à volume élevé.
Nvidia pourrait ajouter tout ou partie de ces améliorations à un RTX 4090 Ti chaque fois qu’il en ressent le besoin. Nous n’avons obtenu le RTX 3090 Ti que 18 mois après les débuts du RTX 3090, mais il y avait beaucoup de facteurs aggravants en jeu. Il est plus probable que nous verrons une actualisation 2023 de la série RTX 40 quelque temps entre neuf mois et 12 mois après la salve initiale.
Il y a aussi la rare chance que Nvidia puisse ignorer complètement le RTX 4090 Ti en faveur d’une nouvelle variante Titan, mais nous doutons que ce soit le cas. Les cartes Titan ont tendance à trop réduire les bénéfices lucratifs des cartes professionnelles RTX série A.