« C’est incroyable de voir à quel point l’architecture est réalisée sur des serviettes d’hôtel », a déclaré Andy Pomianowski, membre d’AMD, devant une salle remplie de presse lors de l’événement de lancement RDNA 3 d’AMD. C’est nouveau pour moi. J’avais toujours supposé qu’une quantité généreuse de marqueurs de tableau d’essuyage avait été le meilleur moyen de noter toutes les idées à venir. Pourtant, l’architecture des puces de RDNA 3 a été notée pour la première fois sur un morceau de papier fragile dans un hôtel lors d’une réunion du personnel hors site.
« Nous sommes confrontés à des défis. Comment pouvons-nous fournir le meilleur produit à nos clients ? Nous avons eu beaucoup de succès sur le marché des serveurs et des ordinateurs de bureau, et l’application de cette technologie aux GPU n’était pas évidente », Sam Naffziger , Corporate Fellow chez AMD, nous dit.
(s’ouvre dans un nouvel onglet)
« Mike [Mantor] et Andy [Pomianowski] avait des objectifs très agressifs, beaucoup de fonctionnalités et d’objectifs que nous savions que nous ne pourrions pas atteindre ensemble sans faire quelque chose de différent. »
« Donc, nous étions chez notre personnel hors site et nous faisions notre part, en étant bons, en prétendant que nous étions engagés, mais toutes les présentations n’étaient pas aussi engageantes. Il y en avait une où nous étions assis là à penser, mon esprit travaille dans l’arrière-plan, et juste en réfléchissant à tous les défis technologiques et aux options. Et j’ai donc commencé à gratter sur un petit bloc-notes d’hôtel là-bas, que personne n’utilise habituellement, mais de temps en temps, ils sont utiles.
Selon Naffziger, il a noté quelque chose qui serait désormais assez familier à tout joueur sur PC qui est à la pointe du dernier matériel : le plan pour les puces dans les GPU récemment annoncés de RDNA 3 : les RX 7900 XTX et RX 7900 XT. (s’ouvre dans un nouvel onglet).
« Donc, le truc GCD / MCD. J’ai rayé quelque chose de remarquablement semblable à ce que nous avons montré hier [at RDNA 3’s launch event] et cela semblait un pari. Alors je l’ai glissé vers Andy, et il s’est assis là et il a fait l’un des siens, vous savez, il a froncé les sourcils et a dit ‘Je pense que ça peut marcher’. »
« Commencez avec une serviette. Ensuite, c’est PowerPoint, puis les équipes d’ingénieurs le font », plaisante Pomianowski.
Si seulement c’était si simple. L’architecture RDNA 3 n’implique que deux types de puces – le GCD et le MCD – mais il y a bien plus que cela ne le suggère.
(s’ouvre dans un nouvel onglet)
Considérez RDNA 3 comme une scission à l’amiable pour le pipeline graphique et la plus grande partie du sous-système de mémoire.
Le GCD est l’endroit où vivent les cœurs de shader réels, connus sous le nom de processeurs de flux dans l’architecture RDNA d’AMD. Celles-ci sont regroupées en unités de calcul doubles, un peu comme RDNA 2, sauf avec une nouvelle ALU polyvalente améliorée pour un meilleur débit d’instructions, une unité d’opération AI améliorée avec le nouvel accélérateur matriciel et un cache vectoriel plus grand. Ces mises à niveau et bien d’autres permettent au Dual CU de RDNA 3 d’offrir une horloge bien améliorée pour les performances d’horloge par rapport à la dernière génération, soit environ 17,4 %.
Huit unités de calcul doubles partagent le cache L1 au sein d’un moteur de shader. Six Shader Engines partagent le cache L2, un processeur de géométrie et un processeur de commandes graphiques. Tout cela vit dans le GCD et est rejoint par le silicium PCIe Gen 4, le moteur multimédia et le moteur d’affichage.
(s’ouvre dans un nouvel onglet)
Et cela conclut un très division de haut niveau du GCD au sein du GPU Navi 31. Pourtant, certaines choses manquent: Infinity Cache, pour sa part, qui est une fonctionnalité clé de RDNA introduite avec RDNA 2, mais aussi un moyen crucial pour le GPU de communiquer avec les puces de mémoire installées hors package sur le PCB de la carte graphique. Vous n’irez pas très loin dans les derniers jeux sans accès à une grande mémoire tampon.
(s’ouvre dans un nouvel onglet)
C’est là qu’AMD utilise ce qu’on appelle un MCD. Cela prend tous les éléments généralement bloqués autour du moteur graphique – le cache Infinity et les interfaces mémoire GDDR6 – et les démarre sur leur propre chiplet. Chaque MCD est beaucoup, beaucoup plus petit que le GCD, mais c’est là que réside l’un des avantages de ce système de puces.
Alors que le GPU Navi 21 trouvé dans le RX 6950 XT est de 520 mm2et le GPU AD102 du RTX 4090 de Nvidia est un énorme 608 mm2le GCD d’AMD pour Navi 31 n’est que de 300 mm2.
Chaque MCD ne mesure que 37 mm2.
Une taille de copeau inférieure permet des rendements plus élevés. Des rendements plus élevés devraient donner une bien meilleure image de l’offre.
« Plus la matrice est petite, meilleur est le rendement, et c’est ainsi, d’un point de vue économique, ce sont tous des rendements très faibles, très, très bons », m’a dit Laura Smith, vice-présidente de Graphics MNC and Product Management. .
« Si vous les mettez tous dans un seul gros dé, alors vous verrez, et vous le voyez dans toutes sortes de produits, vous avez besoin de capacités redondantes, car vous allez avoir des retombées. »
(s’ouvre dans un nouvel onglet)
J’adorerais penser que cette approche chiplet aurait un effet souhaitable sur l’image globale de l’offre et se répercuterait ainsi sur les prix et nous fournirait que les joueurs verront chez les détaillants après la ferveur de lancement initiale. Un seul chiplet qui réduit considérablement la taille de la puce tout en étant également utilisé sur plusieurs produits de la gamme AMD pourrait être un véritable gagnant à cet égard, même si AMD ne cible pas le meilleur GPU de Nvidia. (s’ouvre dans un nouvel onglet) en performances. Cela a certainement fonctionné pour Ryzen, qui a utilisé une approche similaire avec son cIOD, une matrice qui réunissait toutes les fonctionnalités non essentielles du processeur sous un même toit et sur un nœud de processus plus ancien.
La même remarque peut être faite pour les puces RDNA 3 d’AMD en ce qui concerne les nœuds de processus. L’interface mémoire et le cache Infinity n’étaient pas configurés pour bénéficier beaucoup du nœud de processus 5 nm de TSMC, il était donc plus logique de les séparer du cœur et de les fabriquer sur le nœud 6 nm moins cher.
« Lorsque nous examinons la conception des puces, nous voulons la maximiser, ce qui signifie que nous voulons mettre les choses qui rétrécissent bien et tirer parti des nœuds technologiques avancés et coûteux de cette technologie et des choses qui n’en tirent pas beaucoup d’avantages. nous pouvons laisser derrière nous les anciens nœuds technologiques », déclare Naffziger.
« La bonne technologie, le bon travail. »
(s’ouvre dans un nouvel onglet)
Votre prochaine machine
Meilleur PC de jeu (s’ouvre dans un nouvel onglet): Les meilleures machines pré-construites par les pros
Meilleur ordinateur portable de jeu (s’ouvre dans un nouvel onglet): Ordinateurs portables parfaits pour les jeux mobiles
Naffziger a travaillé sur l’approche du chiplet Ryzen d’AMD – c’était son « bébé » pendant des années – il est donc logique qu’il soit le seul à imaginer la nouvelle façon dont cette technologie pourrait être appliquée à un GPU de jeu. Cela a également nécessité une nouvelle interconnexion – les GPU sont des ventouses pour la bande passante – et c’est là que les passionnants Infinity Links d’AMD (s’ouvre dans un nouvel onglet) entre.
Mais dire que tout a commencé sur un bout de papier dans un hôtel lors d’une réunion ennuyeuse. Alors pensez-y la prochaine fois que vous assisterez à une réunion et que vous écouterez quelqu’un vous expliquer pourquoi votre entreprise doit éteindre tout le chauffage du bureau cet hiver, vous pourriez imaginer votre prochaine grande percée sur-le-champ.