blog.cloudflare.com/18-november-20… Tout le monde analyse le rapport d'accident, alors je vais y jeter un œil aussi. Laissons l'IA effectuer une analyse simple : 1. Ils ont modifié les autorisations d'une base de données ClickHouse (une opération très mineure et de routine). 2. Une fois les autorisations modifiées, le comportement des requêtes de ClickHouse a changé, ce qui a entraîné l'écriture de la même ligne de données des dizaines de milliers de fois lors de la génération du fichier de fonctionnalités de gestion des bots. 3. Normalement, ce fichier de fonctionnalités ne pèse que quelques Mo, mais cette fois-ci, il est devenu plusieurs fois plus volumineux. 4. Des centaines de milliers de serveurs périphériques à travers le monde récupèrent automatiquement les fichiers de fonctionnalités les plus récents toutes les quelques minutes. 5. Le code du module de gestion des bots exécuté sur le serveur a une limite de taille codée en dur. 6. Si le nombre de fichiers dépasse cette limite, le module de gestion des bots plantera ou refusera de se charger. 7. Si ce module plante, l'ensemble du système proxy principal (Frontline, ou FL et FL2 en abrégé) deviendra inutilisable. Après avoir examiné l'analyse, j'ai réalisé qu'éviter les problèmes dans un système aussi vaste est extrêmement difficile. Sa complexité est telle que personne ne peut en saisir tous les détails. J'ose même affirmer que la personne qui a écrit cette ligne de configuration ignore probablement que l'équipe de gestion des bots a imposé une limite de taille fixe. Plus un système est vaste, plus il est facile de le faire s'effondrer à cause d'une « erreur fondamentale ».
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.