La communauté Gandi

[Terminé] Incident IAAS

Retour sur les évènements qui ont entrainés l’indisponibilité des VM pour certains de nos clients.

  • 10:25 CEST : Premier incident : 12 nodes raccordés à un  switch rencontrent une erreur rendant les machines injoignables. Plus de 200 VMs sont impactées et donc injoignables.
  • 10:40 CEST : Les nodes sont de nouveau démarrées et sont accessibles, les VMs sont disponibles.
Nos équipes investiguent mais ne trouvent rien de probant.
  • 14:01 CEST : Nouvel incident  : 8 nodes rencontrent de nouveau une erreur rendant les machines injoignables. ~180 VMs sont impactées.
  • 14:09 CEST: Les nodes sont de nouveau démarrées et sont accessibles, les VMs sont disponibles.
Nous avons mis en place des mesures afin de collecter plus d’informations sur le problème.
  • 16:56 CEST : Nouvel incident : 10 nodes impactés deviennent injoignables contenant 321 VMs.
  • 17:10 CEST : Toutes les VMs sont démarrées et sont accessibles.
Des informations précises ont été collectées. Elles devraient nous permettre de régler ce dysfonctionnement aussi vite que possible.