Des pannes majeures chez CrowdStrike, Microsoft laisse le monde avec des BSOD et de la confusion

Agrandir / Un passager est assis par terre tandis que de longues files d’attente se forment aux comptoirs d’enregistrement de l’aéroport international Ninoy Aquino, le 19 juillet 2024 à Manille, aux Philippines.

Ezra Acayan/Getty Images

Des millions de personnes extérieures au secteur informatique découvrent aujourd’hui ce qu’est CrowdStrike, et c’est une très mauvaise chose. Pendant ce temps, Microsoft est également accusé d’être responsable des pannes de réseau mondiales, et entre les deux, on ne sait pas encore vendredi matin qui a causé quoi.

Après que la société de cybersécurité CrowdStrike a livré une mise à jour de son logiciel Falcon Sensor qui protège les systèmes critiques, des écrans bleus de la mort (BSOD) ont commencé à mettre hors service les systèmes Windows. Les problèmes ont commencé en Australie et se sont poursuivis à partir de là.

Les chaînes de télévision, les centres d’appels 911 et même les Jeux olympiques de Paris ont été touchés. Les banques et les systèmes financiers en Inde, en Afrique du Sud, en Thaïlande et dans d’autres pays ont été mis à l’arrêt lorsque des ordinateurs sont tombés en panne. Certains employés ont découvert que leurs ordinateurs portables fournis par leur entreprise démarraient sur des écrans bleus vendredi matin. Les pannes ont paralysé non seulement le système de commande mobile de Starbucks, mais aussi un motel de Laramie, dans le Wyoming.

Les compagnies aériennes, qui ne sont pas les réseaux les plus agiles, ont été particulièrement touchées, avec American Airlines, United, Delta et Frontier parmi les compagnies aériennes américaines débordées vendredi matin.

Le PDG de CrowdStrike est « profondément désolé »

Les solutions proposées par CrowdStrike et Microsoft pour résoudre les problèmes de plantage incessant des systèmes Windows vont du « redémarrage jusqu’à 15 fois » à la suppression de pilotes individuels dans les disques virtuels détachés du système d’exploitation. La présence du chiffrement de lecteur BitLocker sur les appareils concernés complique encore davantage les choses.

Le PDG de CrowdStrike, George Kurtz, a publié sur X (anciennement Twitter) à 5h45, heure de l’Est, que la société travaillait sur « un défaut trouvé dans une seule mise à jour de contenu pour les hôtes Windows », les hôtes Mac et Linux n’étant pas affectés.« Il ne s’agit pas d’un incident de sécurité ou d’une cyberattaque. Le problème a été identifié, isolé et un correctif a été déployé », a écrit Kurtz. Kurtz a déclaré vendredi matin au Today Show de NBC que CrowdStrike était « profondément désolé de l’impact que nous avons causé aux clients ».

Comme l’a noté LittleAlex sur Mastodon, Kurtz était le directeur technique de la société de sécurité McAfee lorsque, en avril 2010, cette société a envoyé une mise à jour qui a supprimé un fichier crucial de Windows XP qui a provoqué des pannes généralisées et a nécessité une réparation de fichiers système par système.

Il faudra un certain temps pour connaître les coûts d’une telle panne et ils seront difficiles à mesurer. L’analyste CloudZero a estimé vendredi en milieu de matinée que l’incident de CrowdStrike avait déjà coûté 24 milliards de dollars, sur la base d’une estimation précédente.

Plusieurs pannes, une responsabilité indéterminée

Les services Microsoft ont également été, dans une coïncidence apparemment terrible, en panne dans la nuit de jeudi à vendredi. Plusieurs services Azure ont été en panne jeudi soir, la cause étant citée comme « un flux de travail de gestion de cluster backend » [that] « Nous avons déployé une modification de configuration provoquant le blocage de l’accès au back-end entre un sous-ensemble de clusters de stockage Azure et des ressources de calcul dans la région Centre des États-Unis. »

Un porte-parole de Microsoft a déclaré à Ars dans un communiqué vendredi que la mise à jour de CrowdStrike n’était pas liée à la panne d’Azure du 18 juillet. « Ce problème a été entièrement résolu », peut-on lire dans le communiqué.

Les reportages sur ces pannes ont jusqu’à présent accusé Microsoft, CrowdStrike ou un mélange peu clair des deux comme étant responsables de diverses pannes. Cela pourrait être inévitable, étant donné que les pannes se produisent toutes sur une seule plateforme, Windows. Microsoft a lui-même publié un « Awareness » concernant le problème BSOD de CrowdStrike sur les machines virtuelles exécutant Windows. L’entreprise l’a fréquemment mis à jour vendredi, avec un correctif qui pourrait ou non surprendre les vétérans de l’informatique.

« Nous avons reçu des commentaires de clients indiquant que plusieurs redémarrages (jusqu’à 15 ont été signalés) peuvent être nécessaires, mais les commentaires globaux indiquent que les redémarrages constituent une étape de dépannage efficace à ce stade », a écrit Microsoft dans le bulletin. Microsoft recommande également aux clients qui ont une sauvegarde datant « d’avant 19h00 UTC le 18 juillet » de la restaurer ou de connecter le disque du système d’exploitation à une machine virtuelle de réparation pour ensuite supprimer le fichier (Windows/System32/Drivers/CrowdStrike/C00000291*.sys) au cœur de la boucle de démarrage.

Le consultant en sécurité Troy Hunt a décrit cette double panne comme « la plus grande panne informatique de l’histoire », affirmant que « c’est essentiellement ce qui nous inquiétait tous avec l’an 2000, sauf que c’est réellement arrivé cette fois-ci ».

United Airlines a indiqué à Ars qu’elle reprenait certains vols, mais qu’elle s’attendait à ce que les perturbations d’horaires se poursuivent tout au long de la journée de vendredi, et qu’elle avait émis des dérogations pour que les clients puissent modifier leurs plans de voyage. American Airlines a annoncé tôt vendredi qu’elle avait rétabli ses opérations à 5 heures du matin, heure de l’Est, mais qu’elle s’attendait à des retards et des annulations tout au long de la journée de vendredi.

Ars a contacté CrowdStrike pour un commentaire et mettra à jour ce message avec une réponse.

Il s’agit d’une histoire en développement et cet article sera mis à jour au fur et à mesure que de nouvelles informations seront disponibles.

Source-147