Riottmx revient dans ce post sur les problèmes des serveurs EU Ouest rencontrés le samedi 14/09 et sur la procédure de redémarrage d’urgence.
Riot tmx sur Rapport d’incident (Traduction - Source)
Invocateurs,Comme à chaque fois à la suite d'un incident majeur sur les serveurs EU Ouest, je souhaite revenir sur ce qui s'est passé et vous fournir des explications. Revenons pas à pas sur ces évènements et sur ce qui a permis de relancer les serveurs.
Petit rappel : à 19h20 (heure de Paris) nous avons constaté qu'il n'y avait plus de nouvelles parties de lancées dans les modes de jeu habituels. De notre côté, tout semblait normal. Nous avons alors conclu que le système de matchmaking n'arrivait plus à créer de parties et que vous restiez coincés dans la file indéfiniment. Certains parmi vous se sont alors reconnectés au jeu, créant ainsi une file d'attente, sans régler le problème. Les parties personnalisées et les parties d'entraînement fonctionnaient toujours (nous avons d'ailleurs noté un accroissement du nombre de parties personnalisées à ce moment). De façon générale, le jeu fonctionnait, tout indiquait que le système de matchmaking était en cause.
Immédiatement nos ingénieurs ont commencé à chercher la raison de la défaillance. Malgré nos efforts et après 50 minutes sans pouvoir résoudre le problème, nous avons opté pour un redémarrage d'urgence du système. Nous savions que certains d'entre vous avaient lancé des parties personnalisées, mais nous ne voulions pas perdre de temps et lancer tout de suite la procédure de fermeture du système. Pour les plates-formes plus petites comme les serveurs RU, cette procédure est instantanée et prend en tout 30 minutes. Les serveurs EU étant plus complexes et plus vastes, le redémarrage complet a pris 2 heures. Nous avons en plus testé la plate-forme avant de l'ouvrir aux joueurs et vérifié que le problème avait été résolu de façon permanente.
Nous sommes désolés pour cet incident qui vous a empêché de pouvoir jouer. Les incidents de ce genre relèvent de l'aléatoire, de l'esprit pervers de notre système informatique, peut-être. Le fait est que nous n'avons pas eu à faire face à ce genre de problème depuis longtemps : nous avons eu des problèmes de latence avec notre fournisseur d'accès au réseau (vous allez recevoir des nouvelles sur ce sujet aussi), mais les problèmes graves venant de notre propre plate-forme sont très rares à présent. Nous sommes toujours en train d'analyser ce qui s'est passé afin d'éviter que cela se reproduise à l'avenir.
Notre Centre d'Opération Réseau et les responsables de la Communauté EU vous ont tenu informés. Les messages concernant les statuts des serveurs étaient constamment mis à jour, et nous avons signalé la présence de ce post.