Pendant Computex 2023, j’ai eu la chance de visiter les imposants bureaux d’AMD à Taipei, Taiwan, pour voir la démo Ryzen AI de l’entreprise et parler avec David McAfee, vice-président et directeur général de l’activité Client Channel. La majeure partie de notre conversation a porté sur les efforts d’AMD dans le domaine de l’IA grand public, mais j’ai également posé quelques questions sur la position d’AMD sur les processeurs hybrides. McAfee m’a dit qu’AMD avait une vision des processeurs hybrides différente de celle d’Intel, ce qui éviterait la complexité qui a forcé Intel à supprimer le support AVX-512 de ses puces.
J’ai interviewé AMD CTO Mark Papermaster il y a deux semaines à Anvers, en Belgique. Il m’a dit que nous « verrions des cœurs hautes performances mélangés à des cœurs économes en énergie mélangés à une accélération » dans le futur client AMD [consumer] processeurs, signalant que, comme Intel avant lui, AMD adopterait à l’avenir une conception de cœur d’exécution de processeur hybride. Ce n’était pas trop surprenant – nous avons vu les premiers signes de deux types de cœurs de processeur différents dans les manuels de logiciels d’AMD il y a des mois. En outre, AMD pose déjà les bases avec ses prochaines puces EPYC Bergamo avec des cœurs Zen 4c denses semblables à des cœurs efficaces.
Les puces pour ordinateur portable Ryzen 7040 actuelles d’AMD présentent déjà une conception hybride, mais pas avec deux types de cœurs de processeur différents. Au lieu de cela, le Ryzen 7040 n’a qu’un seul type de cœur de processeur associé à un moteur d’accélérateur AI intégré qui fonctionne indépendamment des cœurs de processeur et de GPU. Ce moteur offre des avantages pour certains types de charges de travail d’inférence IA, mais les cœurs CPU et GPU sont meilleurs pour d’autres types d’inférence. L’astuce consiste donc à diriger les différentes charges de travail d’IA vers le bon type de cœurs pour extraire les meilleures performances et l’efficacité énergétique.
Ajouter des cœurs de processeur de performance et d’efficacité séparés dans ce mélange introduirait une autre option de calcul pour les charges de travail d’inférence d’IA, et j’ai demandé à McAfee si, conceptuellement, il serait possible que des cœurs d’efficacité soient meilleurs pour l’IA qu’un morceau de silicium dédié (l’IA moteur). McAfee a expliqué que la concentration stricte des moteurs d’IA sur les opérations spécifiques à l’IA lui donnerait un avantage en termes d’efficacité par rapport à tout calcul CPU à usage général, même un noyau d’efficacité.
Ensuite, nous sommes passés à la discussion des puces hybrides d’Intel, qui ont deux types de cœurs, chacun avec sa propre microarchitecture unique. Cela a créé des problèmes intéressants : les cœurs de performance d’Intel prennent en charge AVX-512, mais pas les cœurs d’efficacité plus petits. Cela a conduit Intel à désactiver entièrement la prise en charge AVX-512 (de force à la fin), supprimant ainsi sa propre puce et gaspillant une précieuse zone de matrice.
J’ai demandé à McAfee ce qu’AMD pensait de cette approche des conceptions hybrides.
« Ce que je dirai, c’est ceci, je pense que la façon dont nous y pensons, l’approche de deux cœurs de performance et d’efficacité très différents avec un support ISA, un IPC et une capacité très différents n’est pas nécessairement la bonne approche », a répondu McAfee. « Je pense que cela invite à beaucoup plus de complexité autour de ce qui peut être exécuté où, et comme nous avons examiné différentes options pour la conception de base, ce n’est pas l’approche que nous adoptons.
« Je pense qu’au fur et à mesure que nous déployons cela au fil du temps, ce que vous verrez de nous est une approche qui prend en considération les avantages que différents ciblages de base peuvent offrir, mais en le faisant d’une manière bien plus importante, du point de vue de l’application , beaucoup plus homogène. »
Nous savons déjà que les cœurs d’efficacité Zen 4C d’AMD, qu’il utilisera dans les prochaines puces de serveur Bergame, prendront en charge les mêmes instructions, comme AVX-512, que les cœurs de performance complets. Cependant, ils auront une hiérarchie de cache réduite pour réduire la consommation de zone de matrice. L’objectif des deux types de cœurs ayant le même IPC avec les cœurs de performance et d’efficacité est important. En revanche, les cœurs d’efficacité d’Intel ont un IPC inférieur à ses cœurs de performance (ce qui pourrait entraîner des compromis dans ses autres aspirations e-core, comme Sierra Forest).
« Tout d’abord, ISA, en gardant cela cohérent avec l’endroit où une charge de travail peut fonctionner sur n’importe quel cœur, présente des avantages considérables », a déclaré McAfee. « Et même lorsque vous regardez un processeur de bureau Ryzen aujourd’hui, la façon dont le planificateur Windows est plombé, la capacité d’identifier les cœurs qui sont plus rapides, plus lents, etc., et de diriger les threads vers différents cœurs en fonction du classement ou de la capacité au sein d’un CPU : c’est une technique bien établie que nous utilisons depuis un certain temps, ce qui conduit donc, selon nous, à utiliser un mécanisme où la capacité des cœurs est plus cohérente.
« C’est une façon beaucoup plus éprouvée d’envisager d’intégrer plusieurs types de ciblage de base différents dans une conception. Je pense que l’approche d’Intel invite beaucoup de complexité dans la façon dont elle fonctionne. Et je pense que notre analyse a été cela. Je ne pensez pas que vous nous verrez suivre cette voie de la même manière qu’eux, si et quand il s’agit d’un processeur Ryzen. » McAfee a conclu.
Contrairement à Papermaster, McAfee ne s’est pas engagé sur si ou quand l’hybride viendrait à Ryzen, et nous ne savons pas où AMD introduirait pour la première fois une architecture hybride avec Ryzen, que ce soit avec un APU monolithique ou l’un de ses modèles basés sur des puces. Cependant, il est clair qu’AMD envisage un avenir hybride qui éviterait les compromis que nous avons vus avec les décisions de conception d’Intel derrière les processeurs Alder et Raptor Lake.
Certaines des propres décisions d’AMD pourraient être éclairées par l’analyse des faux pas d’Intel, ou il peut s’agir simplement du bon sens de la réutilisation de l’IP avec l’architecture de base existante. Dans les deux cas, la possibilité de préserver la prise en charge de l’AVX-512 donnerait probablement à AMD l’avantage en termes de performances dans les charges de travail vectorisées, à condition qu’Intel ne suive pas.
Inversement, on pourrait affirmer que l’approche d’Intel consistant à disposer d’une microarchitecture distincte adaptée à un fonctionnement à faible consommation d’énergie est une meilleure approche, même si elle était associée à une prise en charge ISA uniforme sur les deux types de cœurs. Si Intel a corrigé son incompatibilité ISA avec Meteor Lake et maintenu la prise en charge d’AVX-512 sur les deux types de cœurs, cela pourrait également s’avérer être un puissant combo.
Dans les deux cas, il est clair que même si AMD serait le deuxième sur le marché avec une conception hybride, il adoptera une approche très différente. Seul le temps nous dira comment les deux techniques s’empilent dans les benchmarks.