AMD Ryzen 7000 Burning Out: Cause racine identifiée, EXPO et tensions SoC à blâmer

(Crédit image : Speedrookie/Reddit)

Plusieurs rapports d’épuisement des processeurs Ryzen ont fait irruption sur Internet au cours des derniers jours. Les puces endommagées ont non seulement gonflé et surchauffé au point de se dessouder, mais elles ont également causé des dommages importants aux cartes mères dans lesquelles elles sont installées. Nous avons contacté nos contacts de l’industrie et appris de nouvelles informations sur la nature du problème et la portée du correctif prévu par AMD. Nos informations proviennent de plusieurs sources qui souhaitent rester anonymes, mais les informations de nos sources s’alignent sur tous les détails techniques clés.

Tout d’abord, il est important de savoir que cette condition peut se produire avec les modèles Ryzen 7000 standard et les nouvelles puces Ryzen 7000X3D, bien que ces dernières soient beaucoup plus sensibles à la condition, et la cause première puisse varier entre les deux types de puces. AMD publiera bientôt un correctif, mais la chronologie est inconnue. On nous dit que des pannes se sont produites avec toutes les marques de cartes mères, y compris Biostar, ASUS, MSI, Gigabyte et ASRock.

Selon nos sources et appuyées par une déclaration d’ASUS à Der8auer, le problème provient du fait que les tensions du SoC sont modifiées à des niveaux plus élevés dangereux. Cela peut être imposé à partir des tensions préprogrammées utilisées dans les profils d’overclocking de la mémoire EXPO ou lorsqu’un utilisateur ajuste manuellement les tensions du SoC (une pratique courante pour obtenir un peu plus de marge d’overclocking de la mémoire).

Nos sources ont également ajouté des détails supplémentaires sur la nature des défaillances de la puce – dans certains cas, des tensions SoC excessives détruisent les capteurs thermiques et les mécanismes de protection thermique des puces, désactivant complètement son seul moyen de détection et de protection contre la surchauffe. De ce fait, la puce continue de fonctionner sans connaître sa température.

Les puces modernes d’AMD fonctionnent souvent à leurs limites thermiques pour extraire la dernière goutte de performances dans leur plage thermique de sécurité – il n’est pas rare qu’elles fonctionnent à 95 ° C pendant le fonctionnement normal – elles continueront donc automatiquement à consommer plus d’énergie jusqu’à ce qu’il compose retour pour rester à une température de sécurité. Dans ce cas, l’absence de capteurs de température et de mécanismes de protection permet à la puce de recevoir plus de puissance au-delà des limites de sécurité recommandées. Cette consommation électrique excessive entraîne une surchauffe qui finit par endommager physiquement la puce, comme la courbure que nous avons vue à l’extérieur de plusieurs boîtiers de puces, ou le dessoudage signalé par Der8auer.

La puce reçoit un courant excessif à travers le socket de la carte mère pendant cette sorte de spirale de la mort, entraînant ainsi les dommages visibles que nous pouvons voir dans le socket des broches vCore et le renflement des pads LGA de la puce. Cependant, des dommages moins visibles s’étendent également aux rails / broches CPU SoC, CPU_VDDCR_SOC et CPU VDD MSIC – ils ne tirent tout simplement pas assez de courant pour laisser des brûlures visibles comme nous le voyons avec les broches vCore.

DMLA

(Crédit image : Enwyi/Reddit)

Nous savons que 1,25 V est la limite de tension SoC de sécurité recommandée, et on nous dit que 1,4 V et au-delà augmentent définitivement la probabilité de la condition qui se produit. Pour être clair, courir au-delà de 1,4 V ne garantit pas que votre puce grillera, mais vos chances augmenteront. À l’inverse, 1,35 V semble être « sûr ». Procédez cependant à vos risques et périls.

Nos sources indiquent qu’AMD travaille sur un correctif qui inclut un plafond de tension ou un verrouillage dans le firmware/SMU, ce qui devrait empêcher les profils de mémoire EXPO et les simples manipulations du BIOS de dépasser une limite encore indéfinie. On nous dit également qu’AMD ne peut pas complètement empêcher les manipulations de tension du SoC car la quantité fournie à la puce est dictée par les VRM, laissant un moyen aux vendeurs de cartes mères astucieux d’autoriser les changements de tension malgré le verrouillage d’AMD (ce ne serait pas la première fois les vendeurs de cartes mères ont contourné les limites pour offrir des fonctionnalités rares).

Quelques fournisseurs de cartes mères, comme ASUS et MSI, ont déjà publié de nouveaux BIOS pour corriger certains des problèmes. Cependant, nous avons confirmé que des pannes se sont également produites sur les cartes Biostar, ASRock et Gigabyte, de sorte que tous les fournisseurs sont touchés dans une certaine mesure.

Comme pour toutes les formes d’overclocking, tout dommage résultant de l’utilisation d’un profil d’overclocking EXPO n’est pas couvert par votre garantie, mais compte tenu de la situation, nous ne pensons pas qu’AMD ou les fournisseurs de cartes mères utiliseraient le manque de support EXPO garanti pour invalider les garanties.

DMLA

(Crédit image : LT-Cc/Baidu)

Les performances annoncées que vous obtenez d’un profil EXPO ne sont pas non plus garanties par le fabricant de puces. Il convient également de noter que le plafond de tension SoC prétendument prévu par AMD pourrait entraîner une baisse des fréquences d’overclocking de la mémoire stable. Cependant, nous ne pensons pas que cela importera trop à la plupart des propriétaires de Ryzen 7000, car le sweet spot DDR4-6000 devrait très bien fonctionner dans les limites proposées. Cependant, les overclockeurs extrêmes et ceux qui poussent à la pointe des performances pourraient se retrouver avec des limites d’overclocking plus basses. Le temps nous le dira.

Source-138