Les raisons du plantage des services de Google de ce vendredi


Ce vendredi 24 janvier, certains utilisateurs des services de Google à travers le monde, dont Gmail , Agenda et Google+, n'ont pu accéder à leurs comptes en raison de problèmes techniques.

Par souci de transparence, Google a publié un post après la reprise des services, en moyenne 25 minutes plus tard, pour s'excuser de la gêne occasionnée.

Et ce, avant d'attribuer cette interruption de service à une configuration incorrecte dans son système interne qui signalait aux systèmes comment fonctionner. Suite à un bug logiciel, les requêtes des utilisateurs pour leurs données étaient ignorées entraînant l'affichage d'erreurs à travers de multiples autres services.

Google affirme alors que les services semblent fonctionner normalement et qu'il se concentre actuellement sur l'éradication de la source du problème tout en améliorant le temps de récupération lorsqu'un problème de ce type survient.

Voici les actions que compte prendre Google dans les jours à venir :

  1. Corriger le bug dans le générateur de configuration pour prévenir une réccurence et auditer tous les autres systèmes de génération de configuration critiques afin de s'assurer qu'ils ne comportent pas de bugs similaires.

  2. Ajouter une validation supplémentaire des données dans la vérification des configurations, afin qu'une mauvaise configuration générée à l'avenir ne donne pas lieu à une interruption de service.

  3. Ajouter une surveillance supplémentaire ciblée pour détecter plus rapidement et diagnostiquer la cause de l'arrêt du service.