Site Web de technologie italienne Chips et Bits estime qu’AMD « sacrifiera la prochaine production de GPU de jeu Radeon (RX 8000) chez TSMC afin d’augmenter la production de FPGA et de GPGPU ».
Cela revient plus ou moins à allouer plus de capacité de production aux puces IA qu’aux cartes graphiques. Et cela alimente un récit de peur non déraisonnable concernant l’offre de GPU pour les jeux.
Avec l’engouement pour la cryptographie, puis la pandémie et maintenant l’IA, les joueurs ont définitivement eu du mal ces derniers temps. Les prix des cartes graphiques ont atteint des niveaux vraiment ridicules pendant environ 18 mois pendant la pandémie. Même aujourd’hui, la proposition de valeur de nombreuses cartes actuelles semble médiocre, même si la nouvelle Radeon RX 7800 XT d’AMD a un peu aidé.
Pendant ce temps, nous avons déjà vu des rapports selon lesquels AMD annulait les modèles haut de gamme de sa famille RDNA 4 de nouvelle génération, probablement connue sous le nom de Radeon RX 8000 Series. En effet, certaines sources ont rapporté que Nvidia avait pratiquement cessé la production de ses GPU RTX 40 actuels au profit de la production d’un plus grand nombre de ces puces AI H100, très rentables. Donc, cela se produit déjà, mes amis.
Du moins, c’est l’implication. Mais est-ce le cas ? Et si c’est le cas, quelle importance ? Il ne fait aucun doute que Nvidia l’invente absolument avec ces GPU H100 pour l’inférence de l’IA. Et il va de soi que Nvidia privilégierait la capacité de production de TSMC, la fonderie de puces taïwanaise qui fabrique tous les GPU actuels d’AMD et de Nvidia, pour ces puces les plus rentables.
La capacité de production de TSMC est limitée et Nvidia ne peut actuellement pas répondre à la demande pour le H100. Ainsi, chaque GPU conçu pour les jeux ronge les profits plus importants qui peuvent être réalisés grâce aux puces IA.
Cependant, vérifiez en ligne et vous n’aurez absolument aucune difficulté à acheter un GPU Nvidia RTX 40. De la mauviette RTX 4060 d’entrée de gamme au monstre RTX 4090, ils sont tous largement disponibles.
Bien sûr, certains diraient que le prix du RTX 40 est si élevé en raison du boom de l’IA. Cela peut avoir une certaine influence, mais elle n’est, au mieux, qu’indirecte. Les sociétés d’IA n’achètent pas de conteneurs de cartes RTX 4060 Ti et RTX 4070, ce qui est le genre de chose qui s’est certainement produit au plus fort de l’engouement pour le crypto-minage.
Il n’y a donc pas actuellement de distorsion massive entre l’offre et la demande en ce qui concerne les cartes graphiques de jeu. Mais si le boom de l’IA se poursuit, il y aura presque certainement un changement de priorités.
Un peu plus tôt cette année, nous avions signalé que les propres feuilles de route de Nvidia indiquaient que ses GPU RTX 50 de nouvelle génération avaient été repoussés jusqu’en 2025. Compte tenu d’un cycle GPU « normal », on s’attendrait à ce que les cartes RTX 50 apparaissent l’année prochaine.
Il y a de fortes chances que cela s’explique en partie par le fait de permettre à une plus grande partie de la prochaine capacité de nœud 3N de TSMC d’être utilisée pour des puces d’IA plus rentables. D’ici 2025, TSMC aurait dû développer une capacité 3N significative, y compris peut-être la mise en ligne de l’usine de plus en plus tristement célèbre de l’Arizona, permettant à Nvidia de répondre à la demande d’IA tout en développant des GPU de jeu.
Si tel est le cas, un processus similaire se produira sans aucun doute chez AMD. Il veut participer au jeu de l’IA et si sa bête Instinct MI300 AI de 146 milliards de transistors gagne du terrain, elle sera sûrement soumise aux mêmes forces du marché que Nvidia.
Mais voici le problème. S’il s’avère que les puces IA monopolisent toute la capacité de production de pointe dans un avenir prévisible, eh bien, ce sera un succès ponctuel. Les GPU de jeu peuvent se replier sur un nœud derrière les puces IA, ou s’arrêter pendant un cycle en fonction de la façon dont vous souhaitez le visualiser, puis avancer en même temps.
Et n’oubliez pas, Nvidia a réussi un pas en avant très décent en s’en tenant au même nœud avec sa génération de GPU Maxwell en 2014. Ils ont conservé la même technologie de production en 28 nm que les GPU Kepler. Mais l’accent mis sur la conception et l’efficacité avec Maxwell a quand même permis d’obtenir le type de gains de performances auxquels on s’attend normalement avec une réduction de nœud.
En d’autres termes, même si les GPU de jeu sont obligés de se replier sur un nœud pour permettre à des puces plus rentables d’accaparer toute la capacité de production de pointe, ce coup ponctuel ne signifie pas nécessairement l’absence d’une nouvelle génération de GPU plus rapides.
Plus important encore, il ne s’ensuit certainement pas qu’un boom continu de l’IA signifiera un retour de ce ridicule prix pandémique des GPU. Donc les choses ne sont pas idéales. Les cartes graphiques sont encore trop chères et le boom de l’IA n’aide pas. Mais il n’y a probablement aucune raison de paniquer.