La quantité de données générées par les personnes et les machines a augmenté de façon exponentielle, ce qui nécessite une augmentation constante des performances de calcul du centre de données. Pour répondre aux exigences des centres de données de nouvelle génération, AMD s’est fixé l’an dernier l’objectif d’augmenter l’efficacité de ses plates-formes de centres de données accélérées utilisées pour les charges de travail d’intelligence artificielle (IA) et de calcul haute performance (HPC) de 30 fois d’ici 2025 par rapport à ses Plateformes 2020.
Cette semaine, la société a partagé ses progrès et il semble qu’AMD progresse plutôt bien. L’efficacité énergétique de sa plate-forme accélérée pour l’IA et le HPC – qui comprend les processeurs EPYC et les GPU de calcul Instinct – s’est améliorée de 6,79 fois par rapport à la référence de 2020.
Pour ceux qui ne s’en souviennent pas, la machine de base d’AMD pour ses comparaisons 30×25 est un serveur basé sur son CPU EPYC 7742 (64C/128T, 2.25GHz – 3.40GHz, 256MB, 225W) et quatre GPU de calcul Instinct MI50 (5th Gen GCN, 3840 processeurs de flux à 1450 MHz – 1725 MHz, 300 W). Cette machine a produit 5,26 TFLOPS par MI50 sur une matrice DGEMM 4k avec initialisation des données trigonométriques, et 21,6 TFLOPS de FP16 sur des matrices 4k tout en consommant 1582W.
Depuis 2020, AMD a sorti une nouvelle génération de CPU (3e génération EPYC) et deux nouvelles générations de GPU de calcul basés sur son architecture CDNA spécifiquement conçue pour l’IA et le HPC. La machine 2022 d’AMD est équipée d’un processeur EPYC série 7003 à 64 cœurs et de quatre accélérateurs de calcul Instinct MI250 (CDNA 2.0, 13312 SP à 1,0 GHz – 1,70 GHz, 500 W), qui fournissent 13,66 fois plus de FP16 TFLOPS que quatre accélérateurs Instinct MI50. Compte tenu des progrès considérables que les GPU de calcul d’AMD ont réalisés au cours des dernières années, il n’est pas vraiment surprenant qu’AMD démontre une progression constante avec son objectif 30×25.
L’initiative 30×25 d’AMD est une feuille de route à plusieurs voies qui implique d’augmenter les performances brutes du matériel de centre de données accéléré AMD, d’améliorer son efficacité en termes de performances par watt, de mettre en œuvre des optimisations spécifiques aux applications et d’affiner la pile logicielle pour à la fois amplifier les performances et réduire la consommation d’énergie. Tout type d’amélioration (par rapport au matériel de base 2020) rapproche essentiellement AMD de son objectif.
Par exemple, une fois que la référence d’AMD passera à son processeur EPYC « Genoa » à 96 cœurs prenant en charge la DDR5, son efficacité énergétique sera encore plus élevée en raison de la faible consommation d’énergie de la mémoire DDR5, par rapport à la SDRAM DDR4. Pendant ce temps, de nouvelles améliorations des performances CDNA d’AMD dans les applications IA et HPC, via des améliorations matérielles et/ou logicielles, augmenteront encore l’efficacité.
« Bien qu’il reste encore beaucoup à faire pour atteindre notre objectif 30×25, je suis satisfait du travail de nos ingénieurs et encouragé par les résultats jusqu’à présent. Je vous invite à nous contacter alors que nous continuons à faire rapport annuellement sur les progrès », a déclaré Mark Papermaster, CTO d’AMD, dans un communiqué.