Ampere dévoile un processeur à 192 cœurs, des références controversées

Ampere a présenté cette semaine ses processeurs AmpereOne pour les centres de données cloud qui se trouvent être les premiers processeurs à usage général de l’industrie avec jusqu’à 132 qui peuvent être utilisés pour l’inférence IA.

Les nouvelles puces consomment plus d’énergie que leurs prédécesseurs – Ampere Altra (qui restera dans l’écurie d’Ampere pendant au moins un certain temps) – mais la société affirme que malgré une consommation d’énergie plus élevée, ses processeurs avec jusqu’à 192 cœurs offrent une densité de calcul plus élevée que les CPU. d’AMD et d’Intel. Certaines de ces revendications de performance peuvent être controversées.

192 cœurs cloud natifs personnalisés

Les processeurs AmpereOne d’Ampere disposent de 136 à 192 cœurs (par opposition à 32 à 128 cœurs pour Ampere Altra) fonctionnant jusqu’à 3,0 GHz, basés sur l’implémentation propriétaire de l’architecture du jeu d’instructions Armv8.6+ (avec deux vecteurs 128 bits). unités prenant en charge les formats FP16, BF16, INT16 et INT8) qui sont équipées d’un cache L2 d’associativité à 8 voies de 2 Mo par cœur (au lieu de 1 Mo) et sont interconnectées à l’aide d’un réseau mécanique avec 64 nœuds domestiques et un espion basé sur un répertoire filtre. En plus des caches L1 et L2, le SoC dispose également d’un cache de niveau système de 64 Mo. Les nouveaux processeurs sont évalués pour 200W – 350W selon le SKU exact, contre 40W – 180W pour l’Ampere Altra.

(Crédit image : Ampère)

La société affirme que ses nouveaux cœurs sont davantage optimisés pour les charges de travail cloud et IA et présentent des gains d’instructions par horloge (IPC) « puissants et efficaces », ce qui signifie probablement un IPC plus élevé (par rapport au Neoverse N1 d’Arm utilisé pour Altra) sans une augmentation tangible. dans la consommation d’énergie et la zone de matrice. En parlant de zone de matrice, Ampere ne le divulgue pas, mais dit que l’AmpereOne est fabriqué sur l’une des technologies de processus de classe 5 nm de TSMC.

(Crédit image : Ampère)

Bien qu’Ampere ne révèle pas tous les détails sur son cœur AmpereOne, il indique qu’ils disposent d’un préchargeur de données L1 très précis (réduit la latence, garantit que le processeur passe moins de temps à attendre les données et réduit la consommation d’énergie du système en minimisant les accès à la mémoire), récupération raffinée des erreurs de prédiction de branche (plus tôt le CPU peut détecter une erreur de prédiction de branche et la récupérer, cela réduira la latence et gaspillera moins d’énergie) et la désambiguïsation de la mémoire sophistiquée (augmente l’IPC, minimise les blocages de pipeline, maximise l’exécution dans le désordre, réduit latence et améliore la gestion des multiples demandes de lecture/écriture dans les environnements virtualisés).

Source-138