Suite à l'indisponibilité du serveur durant la matinée, Riot revient sur la maintenance prolongée et explique plus en détail ce qu'il s'est concrètement passé. Les premiers retards ont été engendrés par une coupure de courant aux États-Unis.
Lignarius sur 13/02 - Maintenance prolongée (Source)
Salut tout le monde,Riot tmx a donné des explications concernant le temps d'arrêt de ce matin.
« Salut à tous, ce fût clairement une matinée agitée pour nous tous. Notre maintenance d'urgence de la plateforme a duré beaucoup plus longtemps que nous l'avions prévu et voici un résumé de ce qui s'est passé.Hier nous avons trouvé des problèmes dans la nouvelle version de la plateforme et avons décidé par la suite de faire un « rollback » global de certains changements de la mise à jour 4.2. Je n'irai pas trop dans les détails, ce qui est important à savoir c'est que nous avons rapidement décidé de faire la maintenance d'urgence pour éviter d'éventuels problèmes sur les serveurs live. Comme toujours, les plans sont faits avec les heures locales en tête, EUW a donc été le premier environnement à être en maintenance peu de temps après 4 heures du matin.
Nous avons mis la plateforme hors ligne comme convenu et avons commencé la maintenance. Malheureusement, une panne de courant a affecté une région des États-Unis qui a directement affecté certains de nos services pendant la maintenance. Cela a grandement retardé nos plans, nos équipes ont dû rétablir la connectivité à plusieurs reprises, et certains processus ont dû être répétés et vérifiés à maintes et maintes reprises. La maintenance était un effort coordonné entre plusieurs Rioters - certains dans nos bureaux aux États-Unis mais aussi à Dublin et à Sydney, et finalement nous avons envoyé une équipe sur place au centre de données pour compléter le reste de la maintenance. Chaque mise à jour de plateforme demande beaucoup de tests qui prennent du temps eux aussi.
Une maintenance d'EUW prend plus de temps comparé à nos autres environnements de part la taille de la plateforme. Ceci n'est cependant pas une excuse pour un temps d'arrêt de 9 heures et nous sommes en train d'améliorer nos systèmes en interne pour que ceci ne se reproduise plus à l'avenir. Nous avons grandement amélioré nos temps de mise à jour (qui se souvient des mises à jour qui prenaient 10 heures en 2010 ?) et nous allons travailler à améliorer nos procédures d'urgence pour l'avenir. Nous sommes désolés que ceux ayant voulu jouer ce matin aient rencontrés ces problèmes, que nous ayons dû rester vagues dans notre description de la situation et nous allons continuer de surveiller l'état du service.
GL & HF »
Source.