J’ai visité le bureau d’AMD ici à Taipei, Taiwan, pendant Computex 2023 pour avoir une conversation avec David McAfee, vice-président de l’entreprise et directeur général de l’activité Client Channel. J’ai également eu la chance de voir le moteur d’IA Ryzen XDNA d’AMD à l’œuvre dans une démo d’ordinateur portable, et McAfee a discuté des mesures prises par AMD pour préparer le système d’exploitation et l’écosystème logiciel aux cas d’utilisation en plein essor de l’IA qui s’exécuteront localement sur le PC, ce qui nous allons plonger plus loin ci-dessous.
Après avoir suivi la carte des couloirs inspirée du nom de code AMD que vous voyez ci-dessus, je me suis rendu dans la salle de démonstration pour voir la dernière technologie d’AMD en action.
L’ordinateur portable de démonstration d’AMD était un Asus Strix Scar 17 qui est alimenté par le processeur AMD Ryzen 9 7940HS 4 nm associé à une carte graphique Radeon 780M. Ces puces 35-45W sont livrées avec l’architecture Zen 4 et les graphiques RDNA 3. AMD avait également un Asus ROG Zephyrus G14 exécutant la même démo.
Le moteur XDNA AI est un accélérateur dédié qui réside sur la matrice avec les cœurs du processeur. L’objectif du moteur d’IA XDNA est d’exécuter des charges de travail d’inférence d’IA de faible intensité, comme le traitement audio, photo et vidéo, à une puissance inférieure à celle que vous pourriez obtenir sur un CPU ou un GPU tout en offrant des temps de réponse plus rapides que les services en ligne, améliorant ainsi les performances. et économiser l’énergie de la batterie.
Tout d’abord, j’ai ouvert le gestionnaire de tâches pour voir si le moteur d’IA s’énumérerait comme des cœurs visibles avec des métriques d’utilisation, mais le moteur XDNA AI n’apparaît pas comme un périphérique visible dans le gestionnaire de tâches. Comme vous pouvez le voir dans l’album ci-dessus, j’ai trouvé le moteur d’intelligence artificielle répertorié comme ‘AMD IPU Device’ dans le gestionnaire de périphériques. Cependant, nous n’avons pas pu observer la charge ou toute autre télémétrie des cœurs pendant les tests.
Ici, nous pouvons voir le moteur XDNA AI s’attaquer à une charge de travail de reconnaissance faciale. A droite de l’écran, on peut voir une mesure de la latence pour chaque étape de la charge de travail. Les barres sont incroyablement basses et la charge de travail s’est déroulée rapidement à travers une série d’images alors que le moteur d’IA s’occupait de la charge de travail d’inférence, mais nous n’avons aucun contexte sur la façon dont ces chiffres se comparent à d’autres types de solutions.
La démo d’AMD comportait un bouton pour tester son moteur d’IA intégré par rapport au service en ligne Azure ONNX EP, mais l’équipe de démonstration nous a dit qu’elle avait rencontré des problèmes avec le logiciel, donc cela ne fonctionnait pas. Naturellement, nous nous attendrions à ce que le moteur Ryzen AI intégré ait une latence inférieure à celle du service Azure, et logiquement, c’est ce qu’AMD essayait de démontrer. Malheureusement, nous nous sommes retrouvés sans point de comparaison substantiel pour les résultats de référence.
Cependant, la référence montre que l’IA est bien vivante sur les processeurs Ryzen 7040 d’AMD, et la société est également en bonne voie pour augmenter le nombre d’applications pouvant tirer parti de son moteur d’IA.
Ce moteur peut gérer jusqu’à 4 flux AI simultanés, bien qu’il puisse être rapidement reconfiguré pour gérer différentes quantités de flux. Il traite également les instructions INT8 et bfloat16, ces types de données de moindre précision offrant une efficacité énergétique bien supérieure à celle des autres types de données, du moins pour les charges de travail, telles que l’inférence IA, qui peuvent tirer parti des avantages. AMD affirme que ce moteur, un descendant de son IP Xilinx, est plus rapide que le moteur neuronal présent sur les processeurs M2 d’Apple. Le moteur est directement intégré au sous-système de mémoire des puces, il partage donc un pool de mémoire cohérente avec le CPU et le GPU intégré, éliminant ainsi les transferts de données coûteux pour, encore une fois, augmenter l’efficacité énergétique et les performances.
AMD a annoncé la semaine dernière lors de la conférence Build de Microsoft qu’il avait créé un nouvel ensemble d’outils de développement qui tirent parti du fournisseur d’exécution (EP) Vitis AI open source, qui est ensuite mis en amont dans le runtime ONNX, pour faciliter le travail requis pour ajouter un support logiciel pour le moteur d’IA XDNA. McAfee a expliqué que le Vitis AI EP sert comme une sorte de couche de traduction en métal nu qui permet aux développeurs d’exécuter des modèles sans avoir à modifier le modèle de base. Cela simplifie l’intégration, et l’implémentation d’AMD fonctionnera actuellement avec les mêmes applications qu’Intel utilise avec son VPU à l’intérieur de Meteor Lake, comme Adobe. De plus, tout comme l’approche d’Intel, AMD orientera différentes charges de travail d’inférence IA vers le bon type de calcul, qu’il s’agisse du CPU, du GPU ou du moteur XDNA, en fonction des besoins de la charge de travail.
AMD ne fournit pas encore de mesures de performances pour son moteur d’IA, mais McAfee a noté qu’il est difficile de quantifier les avantages d’un moteur d’IA intégré avec une seule mesure de performances, comme TOPS, car une efficacité énergétique plus élevée et une latence plus faible font toutes partie du multi avantages à facettes d’avoir un moteur d’IA. AMD partagera cependant des chiffres à l’avenir.
McAfee a réitéré les plans d’AMD de continuer à exécuter sa feuille de route XDNA AI, ajoutant éventuellement le moteur à d’autres processeurs Ryzen à l’avenir. Cependant, l’écosystème logiciel pour l’IA sur PC en est encore à ses débuts et AMD continuera d’explorer les compromis par rapport aux avantages réels.
Une grande partie de l’avantage d’avoir un moteur d’IA intégré réside dans l’efficacité énergétique, un must dans les appareils à puissance limitée comme les ordinateurs portables, mais cela pourrait ne pas être aussi significatif dans un PC de bureau sans contrainte qui peut utiliser un GPU ou un CPU dédié plus puissant pour les charges de travail d’inférence – mais sans les problèmes de durée de vie de la batterie.
J’ai demandé à McAfee si ces facteurs pouvaient avoir un impact sur la décision d’AMD d’apporter ou non XDNA aux PC de bureau, et il a répondu que cela se résumerait à savoir si la fonctionnalité offre ou non suffisamment de valeur pour qu’il soit logique de consacrer une zone de matrice précieuse à le moteur. AMD évalue toujours l’impact, d’autant plus que Ryzen 7040 fait son chemin sur le marché.
Pour l’instant, AMD ne confirme aucun de ses plans futurs, mais McAfee a déclaré que bien qu’AMD s’engage à ce que le moteur d’intelligence artificielle fasse partie de ses futures feuilles de route, il pourrait ne pas concerner tous les produits. Sur cette note, il a déclaré qu’il pourrait éventuellement y avoir d’autres options pour différents types de puces, comme les PC de bureau, qui tirent parti de la stratégie de puces d’AMD. D’autres options, comme les cartes d’extension, sont également des solutions possibles.
Une chose est sûre : nous continuerons à voir le moteur intégré évolutif XDNA AI faire son apparition dans de nombreux produits AMD à l’avenir. Espérons que la prochaine fois, nous verrons également une meilleure démo.