Tachyum a créé l’un des processeurs les plus puissants au monde : le processeur universel Prodigy T16128. Le Prodigy T16128 dispose de 128 cœurs de processeur 64 bits fonctionnant jusqu’à 5,7 GHz, de 16 contrôleurs de mémoire DDR5 et de 64 voies PCIe 5.0, et peut gérer des charges de travail de calcul à usage général, de calcul haute performance (HPC) et d’IA, le tout sur une seule puce.
Tachyum appelle Prodigy le premier « processeur universel » au monde et affirme qu’il a été conçu dès le départ pour être un processeur polyvalent capable d’exécuter une multitude d’applications informatiques les plus intensives au monde. Non seulement Prodigy gère toutes ces différentes tâches sur une seule puce, mais il le fait avec un budget d’alimentation 10 fois inférieur à celui du matériel traditionnel – et à un tiers du coût.
Tachyum affirme avec audace que la puce de supercalculateur Prodigy offre quatre fois les performances du Xeon d’Intel le plus rapide du marché et triple les performances brutes du H100 de Nvidia dans les applications informatiques hautes performances. Tout en étant 10 fois plus économe en énergie.
Pour créer des performances aussi impressionnantes au sein d’une architecture à cœur unique, Tachyum affirme avoir construit Prodigy avec des capacités de traitement matriciel et vectoriel à partir de zéro, plutôt que d’en faire une réflexion après coup. Prodigy prend en charge une gamme de types de données, notamment FP64, FP32, TF32, BF16, Int8, FP8 et TAI, tous issus des cœurs de processeur individuels eux-mêmes.
Les processeurs Prodigy pourraient changer la donne lorsqu’ils arriveront en 2023. Le dernier matériel de serveur d’AMD, d’Intel et de Nvidia s’appuie tous sur des composants matériels individuels – même au sein d’un seul CPU ou GPU – pour effectuer ces différentes charges de travail. Un exemple de ceci est les GPU de la série RTX de Nvidia, qui nécessitent des cœurs Tensor dédiés à l’apprentissage automatique pour que l’IA fonctionne et des cœurs RT dédiés pour les applications de lancer de rayons.
Prodigy, d’autre part, pourra exécuter des applications de lancer de rayons et d’IA sur des cœurs individuels, et n’aura pas besoin de détourner les données vers une autre puce à l’intérieur du microprocesseur.
L’exécution de toutes ces différentes charges de travail HPC à l’intérieur d’une seule puce pourrait changer radicalement le paysage des serveurs : les entreprises seraient en mesure d’intégrer beaucoup plus de puces dans une batterie de serveurs avec des besoins en énergie et un refroidissement inférieurs.
Le Prodigy T16128 fonctionne sur une technologie de processus de 5 nm d’origine inconnue et fonctionne dans un très petit boîtier FCLGA (pour la puissance qu’il fournit) de 64 mm x 84 mm. Tachyum affirme que la puce est capable d’exécuter 12 AI PetaFLOPS et 90 TeraFLOPS en ce qui concerne les charges de travail HPC. La puce Prodigy peut également exécuter des binaires pour x86, ARM, RISC-V et ISA. Pour une certaine perspective, un seul Nvidia A100 n’est capable que de 5 AI PetaFLOPS.
Chaque cœur est spécifiquement capable de 2 unités vectorielles de 1024 bits, d’opérations matricielles de 4096 bits et de 4 instructions dans le désordre par horloge. La virtualisation et Advance RAS sont également pris en charge. La puce comprend également plus de 128 Mo de cache L2 + L3 avec des capacités de correction d’erreurs. Pour alimenter tous ses cœurs, la puce est livrée avec 16 contrôleurs de mémoire DDR5 évalués jusqu’à 7200 MT/s avec une capacité maximale de 8 To par socket.
Le T16128 est le modèle phare de la gamme Prodigy de Tachyum, avec le T864 à 64 cœurs et le T832 à 32 cœurs remplissant respectivement les emplacements de milieu de gamme et d’entrée de gamme dans la pile de produits. La production commence en 2023, nous devrions donc voir des références réelles de ces puces l’année prochaine.