Il y a une nouvelle passionnante mémoire de la carte graphique technologie à l’horizon qui pourrait entraîner d’énormes gains dans l’un des aspects les plus importants des GPU : la bande passante mémoire. Le nouveau GPU SCM avec technologie DRAM peut offrir des gains maximaux allant jusqu’à 12,5 fois par rapport à la mémoire à large bande passante (HBM), tout en réduisant également la consommation d’énergie.
HBM est une technologie qu’AMD a utilisée dans certains de ses précédents meilleurs concurrents en matière de cartes graphiques, notamment la gamme de GPU AMD Vega tels que l’AMD Radeon VII. Il cherchait à augmenter massivement la bande passante mémoire – un exploit qu’il a largement réussi – en empilant les puces mémoire les unes sur les autres et en les plaçant beaucoup plus près du GPU que le GDDR conventionnel. Cependant, sa production était coûteuse, sa capacité globale limitée et également difficile à refroidir.
Cette nouvelle recherche cherche donc à améliorer l’idée générale du HBM en permettant des quantités de mémoire beaucoup plus importantes, grâce à l’utilisation d’une « mémoire de classe de stockage » (SCM) plutôt que de la DRAM pour la majeure partie du stockage, avec une une plus petite partie de la DRAM est ensuite utilisée comme cache en lecture/écriture pour ce stockage. Cet arrangement est analogue au fonctionnement de la plupart des meilleurs modèles de SSD, avec une petite partie de la DRAM utilisée comme cache de lecture/écriture devant la NAND plus lente.
Le type de SCM utilisé ici est une variante de la mémoire 3DXPoint d’Intel, qui a fait ses débuts il y a quelques années comme un compromis intrigant entre la DRAM plus rapide mais volatile (perd ses données sans alimentation) et plus lente mais non volatile (conserve les données sans alimentation). NON-ET. Il a été brièvement vendu aux formats RAM Stick et SSD, mais il n’a jamais trouvé un rôle plus permanent dans l’écosystème PC.
De nouveaux perfectionnements apportés à ce style de SCM ont cependant conduit cette équipe de recherche à croire qu’une version de ce type de mémoire pourrait être viable pour une utilisation avec les GPU. L’avantage de cette mémoire est qu’elle est moins chère à produire que la DRAM et qu’elle consomme beaucoup moins d’énergie. Cela signifie que les cartes graphiques pourraient être dotées d’énormes capacités de mémoire sans se ruiner ni se fondre.
Cependant, il est crucial pour faire fonctionner le SCM de fournir la bande passante incroyablement élevée et la faible latence nécessaires pour que la mémoire graphique soit utile. C’est là qu’interviennent le cache DRAM et le système intelligent de marquage de la mémoire basé sur le matériel, conçu par l’équipe de recherche POSTECH de l’Université Soongsil.
Les subtilités de la recherche sont très complexes et impliquent, par exemple, des modèles de flux de données pour prédire les modèles typiques d’accès à la mémoire. Le résultat, cependant, est que l’équipe – utilisant un GPU Nvidia A100 modifié – pourrait constater des avantages significatifs en termes de performances de son nouveau système par rapport à l’utilisation de la mémoire HBM conventionnelle (qui elle-même offre déjà une bande passante beaucoup plus élevée que les configurations GDDR standard). L’article résume les résultats en disant :
« Par rapport au HBM, le HMS (pile de mémoire hétérogène) améliore les performances jusqu’à 12,5 fois (2,9 fois au total) et réduit l’énergie jusqu’à 89,3 % (48,1 % au total). Par rapport aux travaux antérieurs, nous réduisons le trafic de sonde de cache DRAM et d’écriture SCM de 91 à 93 % et de 57 à 75 %, respectivement.
Il s’agit d’un développement intéressant, même s’il comporte quelques mises en garde majeures concernant les GPU de jeu. Pour commencer, la recherche est basée sur les charges de travail des centres de données, où les modèles d’utilisation de la mémoire et les exigences globales du système sont très différents des charges de travail des jeux. De plus, cette recherche n’est que cela : elle est en phase de recherche. Même si cela était immédiatement identifié comme la voie claire vers les performances de nouvelle génération, il faudrait probablement attendre quelques générations de cartes avant de voir cette nouvelle technologie intégrée dans les nouvelles cartes graphiques.
Pourtant, il est toujours excitant de voir des chiffres indiquant une augmentation des performances de 12,5x (voire 2,9x) et une réduction de la consommation de 89,3%, car ils suggèrent qu’il existe encore de nombreuses façons pour la carte graphique et le marché plus large de la technologie PC de continuer à tirer leur épingle du jeu. performances, même s’il est de plus en plus difficile pour les producteurs de puces de fabriquer des puces de plus en plus petites.