Dans son briefing aux analystes financiers aujourd’hui, AMD a partagé sa feuille de route GPU ainsi que quelques détails supplémentaires sur sa prochaine architecture RDNA 3. Sans surprise, la société n’est pas entrée dans les détails, mais ce qui a été partagé donne matière à réflexion. AMD affirme que ses puces RDNA 3 feront leurs débuts avant la fin de l’année, date à laquelle au moins certaines des nouvelles cartes trouveront probablement une place sur notre meilleures cartes graphiques répertorier et aider à restructurer le sommet de notre Hiérarchie des benchmarks GPU. Examinons les informations fournies par AMD.
AMD affirme que RDNA 3 devrait fournir une augmentation de plus de 50 % des performances par watt. Comme d’habitude, cela doit être pris avec une grande dose de scepticisme, car la performance par watt est une courbe avec beaucoup de possibilités. L’architecture RDNA 2 d’AMD était également censée améliorer de 50 % les performances par watt, et Nvidia a affirmé que son architecture Ampere offrait 50 % de performances par watt en plus que son architecture Turing précédente. Bien que les deux affirmations soient certainement vraies dans certains cas, de nombreuses comparaisons ont montré des gains beaucoup plus faibles.
Par exemple, sur la base de nos tests de performances et de puissance, le RX 6900 XT est jusqu’à 112 % plus rapide que le RX 5700 XT et utilise 44 % de puissance en plus. Cela représente une augmentation de 48 % des performances par watt (perf/watt), ce qui est suffisamment proche de 50 % pour que nous ne discutions pas ce point. Mais d’autres comparaisons donnent des résultats différents. Le RX 6700 XT est environ 32 % plus rapide que le RX 5700 XT tout en utilisant essentiellement la même quantité d’énergie, ou si vous voulez un très mauvais exemple, le RX 6500 XT est 22 % plus lent que le RX 5500 XT 8 Go tout en utilisant 29 % moins Puissance. C’est une amélioration nette des performances/watt de seulement 10 %.
L’histoire est la même pour Nvidia. Le RTX 3080 est environ 35 % plus rapide qu’un RTX 2080 Ti (à 4K) mais utilise 28 % de puissance en plus. Cela signifie que les performances brutes/watt n’ont été améliorées que de 5 %. Alternativement, le RTX 3070 est environ 23 % plus rapide qu’un RTX 2080 Super, et il utilise 11 % moins d’énergie, soit une amélioration de près de 40 % des performances par watt. Et pour donner un dernier exemple, le RTX 3060 est 33 % plus rapide que le RTX 2060 tout en utilisant 7 % de puissance en plus, ce qui donne une augmentation globale de 24 % des performances par watt.
Le fait est que les affirmations d’AMD de 50% de performances supérieures par watt sont un meilleur scénario. Cela pourrait signifier que le RDNA 3 est 50 % plus rapide tout en utilisant la même puissance que le RDNA 2, ou cela pourrait signifier que c’est la même performance tout en utilisant 33 % de puissance en moins. De manière générale, les produits réels sont susceptibles d’atterrir entre ces deux extrêmes, et il y a fort à parier que toutes les comparaisons ne montreront pas une amélioration de 50% des performances par watt.
D’autres détails pour RDNA 3 consistent en certaines choses que nous avons déjà supposées : il utilisera la technologie de processus 5 nm (presque certainement TSMC N5 ou N5P). Il prendra également en charge les « capacités multimédias avancées », y compris la prise en charge de l’encodage/décodage AV1. AMD a déclaré que RDNA 3 inclut la connectivité DisplayPort 2.0, ce qui faisait déjà l’objet de rumeurs.
L’architecture consiste en une unité de calcul (CU) retravaillée, le principal élément constitutif des GPU RDNA d’AMD, et nous avons entendu de nombreuses rumeurs à ce sujet. Le scénario le plus probable est qu’AMD fera quelque chose de similaire à ce que Nvidia a fait avec Turing et Ampere, en ajoutant des pipelines de calcul supplémentaires.
Turing a des pipelines FP32 et INT32 séparés, et Ampere a ajouté la prise en charge FP32 au pipeline INT32, doublant ainsi potentiellement le calcul FP32 par multiprocesseur de streaming (SM) – c’est l’équivalent Nvidia du CU. Si cela est correct, RDNA 3 aura probablement un grand bond en termes de performances de calcul théoriques par rapport à RDNA 2. Il reste à voir comment cela affectera les performances réelles.
Sans surprise, AMD promet également un cache Infinity de nouvelle génération, qui s’est avéré assez efficace pour augmenter les performances globales sur les différents GPU RDNA 2. Il peut s’agir d’un grand cache, ou peut-être sera-t-il optimisé d’autres manières. Compte tenu des autres mises à jour architecturales attendues, nous nous attendons à ce qu’AMD déplace son GPU RDNA 3 de premier plan vers une interface mémoire plus large, probablement 384 bits, mais la société n’a pas encore commenté cela.
Construire des GPU avec des chiplets
Le dernier et non le moindre est peut-être l’aspect le plus intéressant de RDNA 3. AMD affirme qu’il utilisera des technologies de conditionnement avancées combinées à une architecture de puces. Nous avons vu un mouvement quelque peu similaire avec les chipsets X670/X670E, et AMD a prouvé qu’il pouvait faire des choses très intéressantes avec son architecture de puces CPU. Ce que cela signifie pour les GPU n’est cependant pas tout à fait clair.
Une option serait d’avoir un concentrateur principal avec l’interface mémoire, les capacités d’affichage et multimédia et d’autres matériels de base. Ensuite, les chiplets GPU se concentreraient sur le calcul brut et se relieraient au hub racine via un Infinity Fabric. Il pourrait y avoir un à peut-être quatre chiplets GPU, offrant une grande gamme d’évolutivité. Cependant, AMD aurait probablement besoin de plusieurs hubs racine différents avec cette approche, pour les différents niveaux de produits, ce qui augmenterait les coûts et la complexité.
Ce qui est plus probable, c’est qu’AMD aura un chiplet GPU de base qui cible le segment des performances de milieu de gamme, et il sera capable de relier deux et peut-être jusqu’à quatre de ces chiplets ensemble via une interconnexion à haut débit. Ce serait un peu comme SLI et CrossFire, mais sans avoir à faire un rendu d’image alternatif. Le système d’exploitation ne verrait qu’un seul GPU, même s’il y avait plusieurs chiplets, et l’architecture prendrait en charge le partage des données entre les chiplets.
AMD a déjà fait quelque chose comme ça avec ses GPU de centre de données Aldebaran MI250X, et Intel semble adopter une approche similaire avec ses conceptions Xe-HPC. AMD a également révélé des détails sur les GPU CDNA 3 de son centre de données qui suggèrent que ceux-ci auront jusqu’à quatre puces GPU. Cependant, ce sont des architectures axées sur le calcul plutôt que des conceptions axées sur les graphiques en temps réel, il y a donc différents obstacles qui devront être surmontés. Quoi qu’il en soit, AMD a beaucoup d’expérience avec les chiplets, car il s’agit de plusieurs puces dans un package depuis les premiers processeurs EPYC en 2017, et les conceptions de chiplets depuis Zen 2 en 2019. Il devrait avoir une connaissance approfondie de la façon de faire fonctionner une telle conception. également pour les GPU.
RDNA 4 en 2024, RDNA 3 cette année
Enfin, AMD a partagé la feuille de route GPU ci-dessus, qui montre officiellement RDNA 4 avec une sortie cible quelque temps avant la fin de 2024. Comme vous pouvez l’imaginer, AMD n’a fourni aucune autre information sur RDNA 4 autre que son existence sur la feuille de route. et le schéma de nommage « Navi 4x ». Il utilisera probablement une technologie de processus de 3 nm, ou un équivalent avec un nom différent. Sur la base des lancements précédents, fin 2024 est un pari plus sûr que début 2024 pour le lancement réel.
AMD a également réitéré ses plans pour un lancement de RDNA 3 en 2022, ce qui est bon à voir, même s’il pourrait s’agir d’un lancement très limité et toujours techniquement qualifié. Espérons qu’AMD propose plusieurs niveaux de cartes graphiques avant la fin de l’année, mais nous devrons attendre et voir. Il y a beaucoup de choses que nous ignorons encore sur RDNA 3, comme le nombre de cœurs, les vitesses d’horloge et d’autres améliorations architecturales. AMD a une autre famille de GPU dans son architecture CDNA, que nous avons couverte séparément, mais jusqu’à présent, il n’y a pas eu beaucoup de chevauchement entre RDNA et CDNA. Les cœurs GPU peuvent être similaires, mais RDNA a des accélérateurs de rayons tandis que CDNA inclut des cœurs matriciels. RDNA 3 pourrait suivre les exemples d’Intel Arc et Nvidia RTX et inclure une forme de noyau tenseur/matrice, mais AMD n’a pas suggéré de tels changements jusqu’à présent.
Nous avons encore beaucoup de questions, la principale étant la date de lancement réelle et les performances réelles de RDNA 3. Nous aimerions voir AMD offrir une amélioration des performances similaire à celle apportée avec RDNA 2 (jusqu’au double des performances par rapport à RDNA ), même si cela signifie une consommation d’énergie plus élevée. Imaginez si le chiplet GPU de base pouvait correspondre aux performances d’un RX 6900 XT, puis AMD relie deux ou plusieurs chiplets ensemble pour doubler ou potentiellement quadrupler les performances. Ce serait génial! Mais les rêves sont gratuits, donc jusqu’à ce qu’AMD détaille les changements architecturaux exacts, nous essaierons d’attendre patiemment.