Le 12 juin au soir, le web a vacillé. Une défaillance inédite de Google Cloud a provoqué une interruption massive de nombreux services en ligne, plongeant l’écosystème numérique mondial dans un chaos de plusieurs heures. Ce que certains ont d’abord cru être une cyberattaque s’est révélé être une erreur interne, lourde de conséquences.
Tout a commencé vers 20 heures, heure de Paris. Les utilisateurs ont vu leurs services favoris devenir inaccessibles. Gmail, Spotify, Discord, Snapchat ou encore OpenAI : aucun n’a été épargné. Le quotidien digital de millions de personnes a été stoppé net. En quelques minutes, les alertes sur Downdetector ont explosé. Plus de 44 000 signalements pour Spotify, 10 000 pour Google Cloud. La vague s’étendait.
La vague s’est étendue jusqu’à Google Cloud
Mais la source de cette panne ne venait pas d’une menace extérieure. Google a rapidement identifié la cause : une mise à jour défectueuse d’un quota automatisé dans son système de gestion des identités et accès (IAM). Ce bug a entraîné une véritable auto-saturation de ses propres services, simulant l’effet d’une attaque par déni de service (DDoS). Le système s’est mis à rejeter ses propres requêtes légitimes. Paradoxalement, il s’est auto-bloqué.
Progressivement, les équipes d’ingénieurs ont trouvé une parade. Ils ont contourné la vérification des quotas fautifs pour restaurer l’accès aux services. Cependant, le retour à la normale a pris plus de sept heures. Un laps de temps considérable, à l’échelle d’une infrastructure censée être ultra-résiliente.
Face à l’ampleur du désastre, Google a réagi rapidement. Son PDG, Thomas Kurian, a publié des excuses publiques et promis des mesures correctives. Parmi elles : le renforcement des contrôles de validation de données, une meilleure détection des erreurs avant propagation mondiale, et une amélioration de la gestion des anomalies locales.
Mais cette panne révèle surtout une dépendance critique. Quelques grands acteurs concentrent l’essentiel du trafic mondial. Lorsqu’un seul d’entre eux vacille, c’est tout le web qui tremble. D’après les spécialistes, la redondance géographique et le recours au multi-cloud apparaissent plus que jamais indispensables.
Car si l’erreur était exceptionnelle, ses effets eux, pourraient bien se reproduire. Un web plus résilient passera par une diversification des dépendances et une anticipation technique renforcée.