Nvidia, AMD et Intel ont tous été dans une sorte de course aux GPU multi-die. La théorie est que si vous prenez une puce puissante et que vous la collez de manière transparente à une autre, vous obtiendrez quelque chose de deux fois mieux. Simple, non ? Eh bien, ce n’est pas si simple, et bien qu’AMD ait réussi à faire fonctionner ce concept pour son accélérateur de calcul de superordinateur haut de gamme MI200, personne d’autre n’a encore rien à partager pour le moment.
Eh bien, jusqu’à ce qu’Apple arrive avec son nouveau M1 Ultra System-on-Chip (SoC).
Combinant deux SoC M1 Max, lancés à la fin de l’année dernière, le nouvel Apple M1 Ultra rassemble leurs nombreux cœurs CPU et GPU dans un seul package. Cela donne un processeur basé sur Arm à 20 cœurs, un GPU à 64 cœurs et un moteur neuronal à 32 cœurs sous un même toit. Cela fait une puce avec 114 milliards de transistors au total. Cela peut ensuite être configuré avec jusqu’à 128 Go de mémoire sur le côté.
Juste pour un point de référence, la Nvidia GeForce RTX 3090 dispose de 28,3 milliards de transistors au total. Certes, l’Apple M1 Ultra est un processeur, un processeur graphique et des E / S dans un seul package, puis doublé via une interconnexion, mais Apple a effectivement jeté beaucoup de transistors sur le problème de calcul pour le faire disparaître.
La clé de la puce Ultra est ce qu’Apple appelle « UltraFusion » ; sa nouvelle architecture d’emballage. Il s’agit en fait d’une liaison forte de 10 000 signaux le long du bord de chacune des puces, qui y est placée pendant le processus d’emballage. Cela permet une communication à haut débit entre les deux puces connectées jusqu’à 2,5 To/s. Ce qui est un grand nombre selon toute compréhension.
L’interconnexion elle-même n’est pas un concept entièrement nouveau, et Intel et AMD ont leurs propres interconnexions à large bande passante, mais la version d’Apple la voit certainement jeter tout ce qu’elle peut pour se tenir au courant des dernières nouveautés des autres acteurs majeurs de la construction de puces.
« M1 Ultra est un autre changeur de jeu pour le silicium Apple qui va encore une fois choquer l’industrie du PC. En connectant deux matrices M1 Max avec notre architecture d’emballage UltraFusion, nous sommes en mesure de faire évoluer le silicium Apple vers de nouveaux sommets sans précédent », a déclaré Johny Srouji, Vice-président senior des technologies matérielles d’Apple. « Avec son processeur puissant, son GPU massif, son incroyable Neural Engine, son accélération matérielle ProRes et son énorme quantité de mémoire unifiée, M1 Ultra complète la famille M1 en tant que puce la plus puissante et la plus performante au monde pour un ordinateur personnel. »
Maintenant, la puce M1 Ultra d’Apple ne change pas du tout la donne dans le sens de changer les jeux, vraiment. Vous pouvez exécuter des jeux sur une machine Apple, bien sûr, mais ce n’est en aucun cas ce que ce GPU est conçu pour fonctionner.
La société est également une fois de plus incroyablement méfiante quant aux références exactes qu’elle utilise pour montrer ses performances relatives / Watt ici – tout ce que nous savons, c’est qu’elle a utilisé « certains références standard de l’industrie » et que ses « données de performances GPU discrètes populaires testées du Core i9-12900K avec mémoire DDR5 et GeForce RTX 3060 Ti. Données de performances GPU discrètes les plus élevées testées à partir du Core i9-12900K avec mémoire DDR5 et GeForce RTX 3090. »
Pourtant, Apple affirme que cette puce est capable de surpasser la GeForce RTX 3090 de Nvidia – techniquement la meilleure carte de Nvidia car la RTX 3090 Ti est actuellement absente – sous certaines conditions et avec une consommation d’énergie bien moindre.
C’est une sacrée affirmation, mais comme nous l’avons vu avec le M1 Max, qui était à peu près censé être aussi bon que le GeForce RTX 3080 de Nvidia, la réalité est qu’il y a des mises en garde à tout. Cela est particulièrement vrai si vous êtes un joueur sur PC avec des attentes en matière de performances de jeu. Alors que la puce d’Apple sera sacrément douée pour beaucoup, le jeu n’est vraiment pas ce pour quoi elle est conçue. Alors que l’architecture Ampere de Nvidia l’est plus ou moins.
Même avec une jauge de performance plus généraliste, les TFLOP, le M1 Ultra est encore un peu en retrait des 35,58 TFLOP FP32 du RTX 3090. Le M1 Max était à peu près évalué à 10,4 TFLOP, et si vous deviez exactement le doubler (comme c’est le cas avec les deux matrices M1 Max du M1 Ultra connectées ensemble), vous atteindriez 20,8 TFLOP. Un peu plus bas, même si vous tenez compte du fait que les TFLOP ne sont pas une mesure directe des performances réelles.
Cette efficacité énergétique est cependant très impressionnante. Apple déploie à nouveau ici le processus 5 nm de TSMC, qui est une autre plume dans le chapeau de l’entreprise et la propulse sans aucun doute dans un nouveau territoire en matière d’efficacité énergétique. Intel, AMD et Nvidia n’ont pas encore utilisé de nœud de processus comparable à grande échelle.
M1 | M1 Pro | M1 Max | M1 Ultra | |
---|---|---|---|---|
Transistors | 16B | 33.7B | 57B | 114B |
Noeud de processus | 5nm | 5nm | 5nm | 5nm |
Cœurs de processeur (haute performance + haute efficacité) | 4+4 | Jusqu’à 8+2 | 8+2 | 16+4 |
Cœurs GPU | Jusqu’à 8 | Jusqu’à 16 | Jusqu’à 32 | Jusqu’à 64 |
GPU ALU | 1 024 | 2 048 | 4 096 | 8 192 |
Et si Apple peut faire en sorte que son SoC à double GPU soit vu par un système comme une seule puce, c’est aussi très impressionnant. C’est la vraie difficulté dans la création d’un GPU multi-die : il a été exceptionnellement difficile de faire apparaître ces puces discrètes comme une seule pour un système et de ne nécessiter aucune programmation sur mesure. Au moins pour tout ce qui ne se contente pas d’effectuer des tâches de calcul brutes.
Nous ne voulons pas simplement une autre situation SLI/CrossFire ici – où les développeurs de jeux ou Nvidia/AMD sont en grande partie responsables du fonctionnement de plusieurs GPU en tandem – les GPU multi-die doivent être considérés comme un seul et fonctionner comme un seul à toutes fins utiles .
En ce qui concerne les performances du processeur, Intel et Apple ont maintenant l’équivalent d’une querelle de sang, vous pouvez donc imaginer qu’il n’y a pas d’amour perdu de part et d’autre. Apple s’est concentré sur la comparaison avec l’Intel Core i9 12900K avec ses résultats de référence non spécifiés ici, qui sont à peu près aussi utiles qu’un château gonflable en plomb, mais il revendique des performances presque doublées à 60 watts. Il est certainement probable que les 16 cœurs hautes performances et les quatre cœurs économes en énergie du M1 Ultra soient capables de montrer pourquoi Intel dans certaines capacités et références, bien que des recherches supplémentaires soient nécessaires pour vraiment voir comment ces deux puces se démarquent en termes de performances.
Le M1 Ultra est une puce qui a sans aucun doute fière allure sur le papier et qui aura probablement fière allure avec les charges de travail pour lesquelles Apple l’a conçue, celles de l’espace créatif de la station de travail. Cependant, nous devrons voir comment cela se comporte dans les benchmarks du monde réel (où les benchmarks et les conditions de test sont réellement spécifiés).
Cependant, cela dit, je pense que vous pouvez regarder ce qu’Apple a réussi à faire avec un SoC multi-die de sa propre conception comme un signe très prometteur de ce qui est à venir pour les jeux sur PC. Intel travaille sur des conceptions de SoC en mosaïque qui combinent des puces interconnectées de graphiques Arc et des architectures de processeur de nouvelle génération, à commencer par Meteor Lake en 2023. Alors qu’AMD a empilé des processeurs VRAM et des GPU multi-die juste au coin de la rue, apparemment. On dit également que Nvidia se prépare à une augmentation majeure du nombre de transistors (et de la puissance) avec ses architectures Lovelace et Hopper.
Nous sommes au bord d’une période très excitante dans le développement de GPU, et le M1 Ultra d’Apple est un aperçu de ce qui va arriver de tas d’entreprises qui se battent maintenant toutes pour la domination des performances avec des conceptions complexes et des nœuds de processus de pointe.
Et ce serait négligent de ma part de ne pas discuter du prix par rapport à la puce M1 Ultra d’Apple. La puce d’Apple est intégrée au Mac Studio, le nouveau boîtier de bureau sophistiqué d’Apple. Avec le M1 Ultra complet à l’intérieur et 128 Go de mémoire, vous envisagez un package de 5 799 $. C’est aussi avec seulement un SSD de 1 To. C’est 7 999 $ pour un modèle de 8 To. Vous pouvez réduire ce prix à 3 999 $ si vous abandonnez le M1 Ultra de premier plan pour un modèle de GPU à 48 cœurs et optez pour seulement 64 Go de mémoire.
Considérez donc le M1 Ultra comme un processeur haut de gamme. Apple a également récemment ajouté un réglage de la hauteur à son support de moniteur et a ajouté 400 $ supplémentaires sur son prix pour le privilège. Certaines choses ne changent jamais.