Selon un rapport de Phoronix, la version 6.1 du noyau Linux introduit un nouveau système de journalisation pour identifier les mauvais processeurs et leurs cœurs associés au sein d’un serveur. Le système de journalisation peut détecter exactement quel cœur, CPU et socket a échoué à un moment précis.
Ce n’est pas un système entièrement automatisé, et c’est uniquement pour la journalisation ; cela ne stressera pas le CPU pour vérifier les défauts. En conséquence, Rik Van Riel – qui est responsable de l’autorisation du système de journalisation du processeur pour 6.1, déclare que les administrateurs système voudront exécuter le code du noyau couramment exécuté connu pour provoquer des erreurs avec un système défectueux connu avec l’enregistreur activé pour voir quels cœurs sont mauvais .
L’enregistreur n’est pas parfait, car les tâches du noyau peuvent être reprogrammées vers un autre processeur ou cœur de processeur, mais il trouve que cette stratégie est suffisamment bonne pour trouver de mauvais processeurs ou cœurs. Souvent, les défauts du processeur peuvent être « étrangement spécifiques » où des programmes ou des morceaux de code spécifiques ne planteront que le cœur.
Ce programme n’est pas vraiment conçu pour les consommateurs, mais s’adresse principalement aux administrateurs système exécutant une multitude de serveurs basés sur Linux. Pour ces administrateurs, ce nouvel outil peut être très utile pour traquer de mystérieux défauts matériels lorsque des testeurs de stress CPU complets tels que Prime95 ou Aida64 sont parfaitement stables.
Les vérificateurs d’erreurs tels que celui-ci, ainsi que la nouvelle technologie In-Field-Scan d’Intel, continuent de gagner en popularité dans l’industrie des serveurs. Au fur et à mesure que les processeurs deviennent de plus en plus petits avec des nœuds de pointe, il y a plus de risques que des erreurs se produisent dans le silicium (communément appelées erreurs logicielles).
Au fur et à mesure que nous nous rapprochons des limites physiques des tailles de transistors (telles que 1 nm ou moins), les processeurs devraient théoriquement devenir de plus en plus sensibles aux erreurs, en particulier au rayonnement cosmique. En conséquence, la vérification des erreurs du processeur deviendra exponentiellement plus importante au fil du temps et la densité des transistors continue de s’améliorer.