Our new platform is already available at www.gandi.net

Go to the new Gandi

Une coupure sur le service SimpleHosting est survenue entre 12h53 et 13h27.

Seul une partie des instances était impactés.

Nous cherchons actuellement la cause de cette panne.

Veuillez nous excuser pour la gêne occasionnée.


Les opérations sont actuellement arrêtées sur la plateforme SimpleHosting.

 

En effet, nous avons découvert un problème concernant les opérations SimpleHosting.

Elles s'effectuent correctement mais leur statut reste bloqué en terme de vue ("opération en cours" alors qu'elles sont effectuées).

Cependant, cela bloque les opérations en attente.

 

Nous analysons actuellement le problème.

 

UPDATE : le problème a été trouvé dans un système de logs qui ne permettait pas à l'opération d'être mise à jour. Toutes les opérations sont maintenant terminées.


Un incident est actuellement en cours sur la plateforme Simple Hosting située sur notre data center parisien.

La raison est pour l'instant inconnue de notre équipe technique mais une investigation est cours.

Aussi nous vous prions de ne pas lancer d'opération sur votre instance.

Vous pourrez suivre l'évolution de l'incident sur cette même page.

Nous vous prions de bien vouloir nous excuser pour la gêne occasionnée.

 

EDIT : incident terminé a 20:58

Bréve indisponibilté des instances.


Un incident est en cours sur les Simple Hosting sur le data center Baltimore uniquement.

Nos équipes travaillent sur le problème. Merci de ne faire aucune opération sur vos instances.

Nous vous tiendrons au courant des évolutions.

Mis à jour à 00:51:20 CET :

Un membre de notre équipe technique se trouve sur place, à Baltimore, pour faire le nécessaire.

Mis à jour à 01:35:13 CET :

La situation est revenue à la normale. N'hésitez pas à revenir vers nous en cas de questions. Veuillez nous excuser pour la gêne occasionnée.



Un problème est en cours sur les passerelles qui servent à faire le NAT pour les instances.

Nos équipes travaillent sur le problème.

Nous vous tiendrons au courant des évolutions.

 

15:14 : situation stable, nos équipes restent en alerte et cherchent une solution plus pérenne.

 

Update 16:30 :

 

L'incident du 11 novembre s'inscrit dans un ensemble d'incidents depuis quelques semaines causés par la passerelle d'accès vers Internet pour les instances Simple Hosting (gateway). 
Jusqu'à maintenant, la plate-forme Simple Hosting a subi plusieurs types de problèmes principalement au niveau de la gateway qui est actuellement le maillon le plus faible :
  • instabilité HSRP provoquant des coupures au niveau des passerelles,
  • saturation des tables NAT pour causes diverses DDOS et activités clientes,
  • problème de charge CPU.
Solutions qui vont être mises en place pour remplacer la gateway et améliorer le produit Simple Hosting :
  • remplacement des équipements réseaux qui servent de passerelle pour le produit Simple Hosting par des équipements nettement plus puissants et plus nombreux. Ils se comporteront beaucoup mieux avec la plate-forme actuelle et supporteront l'augmentation du nombre d'instance de Simple Hosting prévu dans le futur,
  • mise en place de niveaux supplémentaire de monitoring pour détecter plus efficacement les problèmes techniques,
  • monitoring et surveillance avancés des abus d'instance spécifique et réaction rapide de notre équipe technique pour que les abus n'entrainent pas de dégradation de qualité de service pour les autres clients.
Veuillez nous excuser pour la gêne occasionnée et soyez assuré que nous prenons le problème de la plate-forme Simple Hosting très au sérieux.

Nous avons de nouveau subi une panne matérielle sur un des équipements utilisé pour le simple hosting.
Ci dessous la chronologie des événements :
- 21:06 PM CET : l'équipement monte en utilisation CPU
- 21:06 PM CET : l'équipement est a 100% de CPU sans raison apparente et ne répond plus
- 21:08 PM CET : décision prise de basculer sur l'équipement secondaire
- 21:08 PM CET : l'équipement secondaire présente les même symptomes alors que le trafic n'a pas été basculé
- 21:09 PM CET : tentative de débugage pour comprendre ce qui se passe.
- 21:26 PM CET : bascule sur le deuxième équipement qui est stabilisé
- 21:27 PM CET : retour à la normale du service
- 23:42 PM CET : suite à l'incident réseau il y a eu un effet de bord sur les DNS, les instances simple hosting n'avaient plus de résolution DNS depuis 21:06 PM CET, problème maintenant résolu (provoquant des problèmes d'envois d' emails)
Détail :
- Les équipements réseaux servant de gateway pour le simple hosting ont montré des signes de faiblesses, le diagnostic sur l'équipement principal est en cours (probablement un problème de mémoire sur l'équipement). Nous utilisons l'équipement secondaire pour le moment.

Une partie des instances Simple Hosting est impactée par un problème technique. Notre équipe travaille à la résolution du problème.

Veuillez nous excuser pour la gêne occasionnée.

Mise à jour 12h50 CEST : La panne était du à un équipement réseau. Notre équipe à fixé le problème, le service est de nouveau disponible.


Nous avons reçu une alerte concernant un problème sur le centre de données de Baltimore/USA.

 

11 machines physiques ont cessé de nous répondre.

 

Nous analysons le problème avec l'équipe technique.

 

Navré de la gêne occasionnée par ce problème.

 

UPDATE : un membre de notre équipe technique est en route pour le centre de données.

UPDATE : nous avons en fait perdu un équipement réseau type switch dont la redondance n'aurait pas fonctionné. Les machines physiques remontent.



Page   1 2 3 4 5 68 9 10
Change the news ticker size