L’architecture Ada Lovelace de Nvidia inaugure un nouveau niveau de performances au sommet de la pile, avec le RTX 4090 surpassant la génération précédente RTX 3090 Ti de 52% en moyenne dans nos benchmarks de rastérisation et de 70% dans les benchmarks de lancer de rayons – tous deux à 4K , naturellement. La 4090 se situe désormais confortablement au sommet de notre hiérarchie de références GPU et se classe parmi les meilleures cartes graphiques du marché, du moins si vous avez les poches profondes.
Malheureusement, le passage du 4090 au RTX 4080 est plutôt précipité, faisant chuter les performances de 23 % pour la rastérisation et de 30 % pour le lancer de rayons. Descendre d’un autre niveau au nouveau RTX 4070 Ti réduit de 22% les performances par rapport au 4080. Si vous gardez une trace – et nous aimons vraiment garder le score – cela signifie que la carte Ada de troisième chaîne arbore le GPU AD104 est plus lent que la génération précédente 3090 Ti, peu importe les affirmations contraires de Nvidia qui reposent sur des références utilisant la génération de trames de DLSS 3.
Ce qui est peut-être plus alarmant avec le RTX 4070 Ti, c’est qu’il ne dispose que d’une interface mémoire de 192 bits. Il a toujours 12 Go de mémoire GDDR6X, et le grand cache L2 en général signifie que le bus plus étroit n’est pas un tueur d’affaire, mais les choses ne semblent pas si bonnes alors que nous envisageons les futures pièces de la série RTX 40 de niveau inférieur comme le 4060 et 4050.
Nvidia a récemment annoncé la gamme complète de GPU pour ordinateurs portables de la série RTX 40, allant du mobile RTX 4090 qui utilise le GPU AD103 (essentiellement un mobile 4080) au RTX 4050 au son anémique. Voici la liste complète des spécifications pour les pièces mobiles .
Carte graphique | RTX 4090 pour ordinateurs portables | RTX 4080 pour ordinateurs portables | RTX 4070 pour ordinateurs portables | RTX 4060 pour ordinateurs portables | RTX 4050 pour ordinateurs portables |
---|---|---|---|---|---|
Architecture | AD103 | AD104 | AD106 ? | AD106 ? | AD107 ? |
Technologie de processus | TSMC 4N | TSMC 4N | TSMC 4N | TSMC 4N | TSMC 4N |
Transistors (Milliards) | 45,9 | 35,8 | ? | ? | ? |
Taille de matrice (mm^2) | 378,6 | 294,5 | ? | ? | ? |
SMS | 76 | 58 | 36 | 24 | 20 |
Shaders GPU | 9728 | 7424 | 4608 | 3072 | 2560 |
Noyaux tenseurs | 304 | 232 | 144 | 96 | 80 |
Traçage de rayons « Cores » | 76 | 58 | 36 | 24 | 20 |
Booster l’horloge (MHz) | 1455-2040 | 1350-2280 | 1230-2175 | 1470-2370 | 1605-2370 |
Vitesse VRAM (Gbit/s) | 18 ? | 18 ? | 18 ? | 18 ? | 18 ? |
VRAM (Go) | 16 | 12 | 8 | 8 | 6 |
Largeur du bus VRAM | 256 | 192 | 128 | 128 | 96 |
Cache L2 | 64 | 48 | 32 | 32 | 24 |
POR | 112 | 80 | 48 | 32 | 32 |
TMU | 304 | 232 | 144 | 96 | 80 |
TFLOPS FP32 (boost) | 28.3-39.7 | 20.0-33.9 | 11.3-20.0 | 9.0-14.6 | 8.2-12.1 |
TFLOPS FP16 (FP8) | 226-318 (453-635) | 160-271 (321-542) | 91-160 (181-321) | 72-116 (145-233) | 66-97 (131-194) |
Bande passante (GBps) | 576 | 432 | 288 | 288 | 216 |
TDP (watts) | 80-150 | 60-150 | 35-115 | 35-115 | 35-115 |
Il y a fort à parier que le RTX 4070 de bureau utilisera le même AD104 que le RTX 4070 Ti, juste avec moins de SM et de shaders. Desktop RTX 4060 Ti, en supposant que nous obtenions cela de sitôt, peut ou non utiliser AD104; la seule autre option serait probablement le GPU AD106 utilisé dans le mobile 4070/4060. Et c’est un problème.
La génération précédente RTX 3060 Ti était livrée avec 8 Go de GDDR6 sur une interface 256 bits. Nous n’étions pas particulièrement satisfaits du manque de VRAM, en particulier lorsque AMD a commencé à livrer le RX 6700 XT (et plus tard le 6750 XT) avec 12 Go de VRAM. Nvidia a essentiellement fait une correction de cap avec le RTX 3060 et lui a donné 12 Go de VRAM, ce qui en fait une belle avancée par rapport au précédent RTX 2060 – et même le 2060 a finalement vu des modèles de 12 Go, bien que les prix les aient rendus pour la plupart peu attrayants.
Maintenant, nous parlons de RTX 4060 qui reviendra très probablement à 8 Go, et ce serait nul. Il existe maintenant de nombreux jeux pouvant dépasser 8 Go d’utilisation de VRAM, et ce nombre ne fera qu’augmenter au cours des deux prochaines années. Mais Nvidia n’a pas beaucoup d’autres options, puisque les capacités de mémoire GDDR6 et GDDR6X plafonnent à 2 Go par canal 32 bits.
Il est possible de faire du mode « clamshell » avec deux puces de mémoire par canal, une de chaque côté du PCB, mais c’est assez désordonné et pas quelque chose que nous nous attendrions à voir dans un GPU grand public. Cela pourrait amener l’interface 128 bits jusqu’à 16 Go de VRAM, ce qui serait encore une fois étrange car les pièces de niveau supérieur comme le 4070 Ti n’ont que 12 Go. Pourtant, cela sonne mieux qu’un modèle RTX 4060 8 Go pour moi !
Et qu’en est-il du RTX 4050 ? Peut-être que Nvidia s’en tiendra à l’interface 128 bits sur le GPU AD106 et n’utilisera pas AD107 sur une partie de bureau – c’est essentiellement ce qui s’est passé avec GA107 qui était presque exclusivement utilisé pour l’ordinateur portable RTX 3050. Mais s’il essaie d’utiliser AD107 dans un bureau, il n’aurait que jusqu’à 6 Go de VRAM, encore une fois avec la VRAM à clapet étant une sortie potentielle.
Ce ne sont pas seulement les capacités de mémoire qui suscitent des inquiétudes. Nous avons dit dans la revue RTX 4070 Ti que les performances n’étaient pas mauvaises, mais ce n’était pas non plus incroyable. Il s’agit essentiellement d’une version moins chère d’un RTX 3090, avec la moitié de la VRAM et une consommation d’énergie inférieure. Le 4070 Ti se débrouille avec 60 multiprocesseurs de streaming (SM) et 7680 cœurs CUDA (shaders GPU), soit un peu plus que le RTX 3070 Ti sortant. Mais l’AD106 pourrait atteindre seulement 40 SM, peut-être même 36 SM, ce qui le placerait sur un territoire similaire au RTX 3060 Ti sur le nombre de cœurs, ne laissant que les horloges GPU comme amélioration des performances.
Mettez ces deux choses ensemble – VRAM insuffisante et augmentations relativement mineures du nombre de shaders GPU – et nous envisageons probablement des améliorations de performances modestes par rapport aux GPU de la génération Ampere précédente.
Nvidia proposera ensuite des améliorations de performances DLSS 3, qui ne s’appliquent qu’à un sous-ensemble de jeux et n’offrent pas non plus de véritables augmentations de performances, et les choses commencent à paraître encore pires. Une partie de l’avantage d’avoir un GPU capable d’exécuter des jeux à 120 ips aujourd’hui est que, à mesure que les jeux deviennent plus exigeants, il pourra toujours faire 60 ips dans la plupart des jeux dans quelques années. Mais que se passe-t-il quand ce ne sont pas réel fréquences d’images ?
Supposons un jeu fonctionnant à 120 ips grâce à la technologie Frame Generation de DLSS 3, avec une performance de base de 70 ips. Tout va bien pour le moment, mais sur la route, les performances de base tomberont en dessous de 40 ips à mesure que les jeux deviennent plus exigeants, et finiront par tomber en dessous de 30 ips. Ce que nous avons constaté, c’est que Frame Generation avec une fréquence d’images de base inférieure à 30 ips ressemble toujours à moins de 30 ips, même si le moniteur reçoit deux fois plus de mises à jour d’images par seconde.
Cette même logique s’applique également aux fréquences d’images plus élevées, donc DLSS 3 à 120 ips avec une base de 70 ips ressemblera toujours à 70 ips, même si cela semble un peu plus lisse à l’œil. La plupart des gens ne pourront pas faire la différence entre des taux d’entrée à 70 échantillons par seconde et des entrées à 120 échantillons par seconde. Mais lorsque vous commencez à tomber en dessous de 40, même les joueurs non professionnels commenceront à sentir la différence.
Ou pour le dire plus crûment : DLSS 3 et Frame Generation ne sont pas la panacée. Ils peuvent aider à lisser les visuels et peut-être améliorer un peu la sensation des jeux, mais l’avantage ne sera pas aussi perceptible que les images entièrement rendues réelles avec de nouvelles entrées utilisateur prises en compte, en particulier lorsque les performances chutent en dessous de 60 ips.
Cela ne veut pas dire que c’est une mauvaise technologie – c’est assez intelligent en fait – et cela ne nous dérange pas qu’elle existe. Mais Nvidia doit cesser de comparer les scores DLSS 3 aux résultats non DLSS 3 et d’agir comme s’il s’agissait de la même chose. Prenez le framerate de base avant Frame Generation et ajoutez peut-être 10 à 20% et c’est ce à quoi ressemble un jeu, pas les 60 à 100% de fps plus élevés que les benchmarks montreront.
Pour en revenir au sujet à l’étude, les futurs GPU grand public et économiques de la série RTX 40 battront sans aucun doute les modèles existants en termes de performances pures, et ils offriront également la prise en charge de DLSS 3. Espérons que Nvidia reviendra à des prix plus proches de la génération précédente, car si le RTX 4060 coûte 499 $ et le RTX 4050 coûte 399 $, ils finiront par être des mises à niveau mineures par rapport aux cartes existantes à ces prix.