Comment un seul ingénieur a fait tomber Twitter

Le site Web de Twitter est en train de se briser de nouvelles façons – et bien que la société ait réussi à se remettre de sa dernière panne en quelques heures, l’histoire derrière la façon dont il s’est cassé suggère qu’il y aura probablement des problèmes similaires dans un proche avenir.

Lundi matin, les utilisateurs de Twitter se sont connectés pour trouver un fourré de problèmes connectés. Cliquer sur les liens ne les ouvrirait plus ; à la place, les utilisateurs verraient un mystérieux message d’erreur indiquant que « votre plan d’API actuel n’inclut pas l’accès à ce point de terminaison ». Les images ont également cessé de se charger. D’autres utilisateurs ont signalé qu’ils ne pouvaient pas accéder à TweetDeck, le client appartenant à Twitter pour les utilisateurs professionnels.

Le chaos a pris le dessus sur la chronologie, alors que les utilisateurs tweetaient avec véhémence à propos de la panne – illustrant souvent leurs points avec des images que personne ne pouvait voir car elles ne se chargeaient pas.

« Si vous faites un changement maintenant, tout casse »

Dans un tweet, la société a offert la plus vague des explications sur ce qui se passait.

« Certaines parties de Twitter peuvent ne pas fonctionner comme prévu en ce moment », a tweeté le compte d’assistance de la société. « Nous avons fait un changement interne qui a eu des conséquences inattendues. »

Le changement en question faisait partie d’un projet de fermeture de l’accès gratuit à l’API Twitter, Plateforme peut maintenant confirmer. Le 1er février, la société a annoncé qu’elle ne prendrait plus en charge l’accès gratuit à son API, ce qui a effectivement mis fin à l’existence de clients tiers et considérablement limité la capacité des chercheurs extérieurs à étudier le réseau. La société a construit une nouvelle API payante avec laquelle les développeurs peuvent travailler.

Mais signe de l’ampleur des coupes d’Elon Musk dans l’entreprise, un seul ingénieur en fiabilité du site a été affecté au projet, nous dit-on. Lundi, l’ingénieur a effectué un « mauvais changement de configuration » qui « a essentiellement cassé l’API Twitter », selon un employé actuel.

Le changement a eu des conséquences en cascade au sein de l’entreprise, faisant tomber une grande partie des outils internes de Twitter ainsi que les API destinées au public. Sur Slack, les ingénieurs ont répondu avec des variantes de « merde » et « Twitter est en panne – tout le truc » alors qu’ils se démenaient pour résoudre le problème.

Musk était furieux, nous dit-on.

« Un petit changement d’API a eu des ramifications massives », Musk tweeté plus tard dans la journée, après que l’investisseur de Twitter, Marc Andreessen, a publié une capture d’écran montrant que les défaillances de l’API de l’entreprise étaient à la mode sur le site. « La pile de code est extrêmement fragile sans raison valable. Aura finalement besoin d’une réécriture complète.

Les licenciements incessants ont laissé l’entreprise avec moins de 550 ingénieurs à temps plein

Certains employés actuels sont favorables à ce point de vue, qui attribue au moins une partie de la responsabilité des problèmes de Twitter à des défaillances techniques antérieures à la propriété de l’entreprise par Musk. Le échouer baleine est devenu une icône de l’ancien Twitter pour une raison.

« Il y a tellement de dette technologique de Twitter 1.0 que si vous faites un changement maintenant, tout casse », a déclaré un employé actuel.

Pourtant, lorsque Musk a repris l’entreprise, il a promis d’améliorer considérablement la vitesse et la stabilité du site. Ses associés ont passé au crible le personnel existant pour ses prouesses techniques, supprimant finalement des milliers de travailleurs qui n’étaient pas jugés suffisamment «techniques» pour réussir sous la direction de Musk.

Mais les licenciements incessants ont laissé l’entreprise avec moins de 550 ingénieurs à temps plein, nous dit-on. Et tout comme les anciens employés l’ont prédit depuis le début, les pertes ont rendu Twitter de plus en plus vulnérable aux pannes catastrophiques.

Le changement de configuration errant de lundi était au moins la sixième panne de service très médiatisée sur Twitter cette année :

« Ce type de panne est devenu si fréquent que je pense que nous en sommes tous insensibles », déclare un employé actuel.

Et ce ne sont que les pannes de service. D’autres problèmes, comme celui qui a conduit les tweets de Musk à être rendus plus visibles sur la chronologie que ceux de tout autre utilisateuront également bouleversé la base d’utilisateurs.

À bien des égards, la panne de lundi a représenté le point culminant du leadership de Musk dans l’entreprise jusqu’à présent. Dans un effort résolu pour réduire les coûts de son achat de 44 milliards de dollars, il a réduit le personnel et réduit les offres gratuites de Twitter.

Cela a ouvert la voie à la dotation en personnel d’un seul ingénieur sur un projet majeur – un projet lié à plusieurs systèmes interconnectés critiques dont dépendent à la fois les utilisateurs et les employés.

Et avec peu de travailleurs compétents sur place pour rétablir le service, il a fallu toute la matinée à Twitter pour résoudre le problème. « C’est ce qui se passe lorsque vous licenciez 90 % de l’entreprise », déclare un autre employé actuel.

À l’intérieur du QG de Twitter, cependant, l’ambiance était presque légère. « Nous rions jusqu’au bout », dit un autre employé actuel.


source site-132