MGG / Actualités jeux vidéo / League of Legends (LoL) /

Problèmes serveur du 17, Retour

Problèmes serveur du 17, Retour
1

Suite aux problèmes rencontrés sur tous les serveurs hier, Riot explique ce qu'il s'est passé, fait un retour sur la situation et répond aux questions les plus récurrentes.

Problèmes serveur du 17, Retour

Suite aux problèmes rencontrés sur tous les serveurs hier, Riot explique ce qu'il s'est passé, fait un retour sur la situation et répond aux questions les plus récurrentes. 

 

Riot GamesLignarius sur Concernant la panne du 17 Mars (Source)


Salut à tous,

Je vous traduis ici un post de Rincewind qui explique ce qui s'est passé hier :


« Les détails concernant la panne d'hier nous font faire un facepalm. C'est l'histoire typique que l'on peut entendre de n'importe quelle startup qui grandit à une vitesse exponentielle.

Comment est-ce que l'on garde trace de quels systèmes sont en production et de ceux qui ne le sont pas ? Quand vous êtes une petite entreprise, vous le faites avec une simple page web. Au fil du temps vous y ajoutez des fonctionnalités jusqu'au jour où elle vous paraît encombrante et vous la remplacez alors avec des logiciels qui gardent trace de votre inventaire.

Nous sommes passés à un nouveau système. Il est rapide, a toutes les fonctionnalités pour représenter des systèmes visuellement à grande vitesse et fiable. Cependant il n'est fiable que si les données concernant le système d'inventaire est à jour et que l'on peut s'y fier.

Quand nous faisons une migration vers de nouveaux systèmes, nous mettons les anciens serveurs hors service. C'était notre but hier, de mettre de vieux serveurs hors service. Malheureusement cela s'est transformé en cauchemar qui a causé une panne à l'échelle globale.

Ce que nous appelons le lanceur, c'est ce petit bouton qui dit « JOUER » que les joueurs cliquent pour passer de l'écran de connexion vers le client. Nous configurons l'état du lanceur pour différentes régions depuis un ensemble de serveurs de bases de données centralisé. Ils servent également à gérer d'autres contenus comme les actualités, et les pages que vous voyez immédiatement après vous être connectés. Cette partie du système est relativement statique et ne change pas souvent.

Le contenu provient des bases de données, puis est mis en cache par les serveurs web. Puisque le contenu est mis en cache pour une période de temps assez longue, cela ne cause pas beaucoup de trafic vers la base de données. Hier, pendant le processus de mettre les vieux serveurs hors service, nous avons éteint quelques serveurs qui selon notre outil d'inventaire n'étaient pas en production.

Vous pouvez deviner la suite de l'histoire.

Quelques minutes plus tard, le lanceur, les actualités et les pages du client ont disparu. Le lanceur disait « undefined » au lieu de « JOUER ». Les joueurs du monde entier se sont retrouvés dans l'incapacité de se connecter.

Le contenu des serveurs web en charge de la mise en cache avait expiré, ils se sont donc tournés vers la base de données pour obtenir du nouveau contenu, cependant ils ne pouvaient atteindre la base de données puisqu'elle était hors ligne. Nous avons coupé des serveurs qui étaient en production par accident, car ils étaient indiqués par erreur comme n'étant pas en production.

Après quelques coups de fil en panique à notre équipe dans le centre de données, les serveurs de base de données furent remis en service. Un serveur de base de données fait ce qu'il est censé faire après une mise en arrêt incorrecte, il passe en mode récupération et vérifie l'intégrité des données. Selon la taille des données ce processus peut prendre assez longtemps. Dans notre cas c'est ce qui s'est passé et nous avons dû faire nos vérifications d'intégrité.

En parallèle nous avons commencé à implémenter un correctif qui permettrait au bouton « JOUER » de s'afficher au cas où le processus de récupération prendrait un long moment. Les bases de données ont mis un certain temps pour récupérer, c'est pourquoi nous avons utilisé le correctif pour revenir à un état de marche, bien que la récupération n'était pas terminée.


FAQ :

WTF Rincewind c'est une erreur d'amateur, comment pouvez-vous mettre des services hors ligne sans vérification ?

C'est une erreur dont nous avons tiré des leçons et nous allons éduquer notre équipe sur comment utiliser ces outils de manière efficace, mais aussi s'assurer de la véracité des informations présentées. C'est un symptôme d'un environnement qui passe d'un ancien processus à un nouveau processus. Cette situation se présente souvent pour des petites entreprises qui grandissent exponentiellement en peu de temps.


Pourquoi ne pas vous être rabattus sur les bases de données esclaves pour tout remettre en ligne ?

Nous avons accidentellement mis les bases de données esclaves hors service dans le cadre de la mise hors service des vieux serveurs.


Euh... Il semblerait que vous ayez des points d'échec singuliers

C'est vrai et c'est quelque chose que nous corrigeons en ce moment même. Nous allons nous assurer qu'aucune base de données ne soit responsable de stocker les informations de toutes les régions. Tous les systèmes sont en train d'être découplés afin de devenir leur propre service pour qu'ils ne causent pas un « effet domino » de se mettre hors ligne les uns les autres.


Comment pouvez-vous garantir que ceci ne se reproduira pas une fois le nouveau centre de données d'Amsterdam opérationnel ?

Nous construisons le centre de données d'Amsterdam de zéro, Nous ne serons plus affectés par de vieux outils ou des informations potentiellement obsolètes. Nous avons de meilleurs outils pour gérer ces environnements sans être affectés par une infrastructure dépassée. Nous sommes tous impatients que le nouveau centre de données soit opérationnel. »


Source.

1
MGG
Alexandretta il y a 10 ans

le 18 à 21:30 impossible de se connecter

L'actu

En Continu

18:25 LoL — Patch notes 14.23 : Déjà des changements pour Ambessa Medarda
13:08 Ce personnage d'Arcane pourrait être la clé des futures séries de Riot Games dans l'univers de LoL
13:37 5 saisons pour la série Netflix Arcane au lieu de 2 ? Un des patrons de Riot Games revient sur cette rumeur qui enflamme les fans de LoL
19:01 LoL Patch 14.23 : Une nouvelle fournée de skin Arcane arrive dans la Faille de l'invocateur pour célébrer la seconde saison de la série
13:30 Arcane Saison 2 : Qu'est-ce que la Rose Noire ? On vous dit tout ce qu'on sait sur cette organisation secrète
15:13 Arcane Saison 2 : Voici les 5 questions des fans auxquelles la fin de la série Netflix doit absolument répondre
19:47 LoL a aujourd'hui perdu ce petit truc qui rend la série Arcane si géniale
19:44 Le plus gros streamer LoL du monde monte sa propre équipe esport !
17:33 Voici 5 détails cachés dans la saison 2 d'Arcane que vous ne pouvez comprendre qu'en ayant joué à LoL
15:23 Oui, il y aura bien d'autres productions League of Legends après Arcane, mais il faudra attendre un long moment avant de les découvrir

Articles

recommandés

Patch 14.18 : Le patch officiel des Worlds 2024 !
Riot Games va augmenter les prix des achats dans League of Legends, Valorant et ses autres jeux dans certaines régions...
"C'était un peu exagéré", Riot Games avait promis que tout changerait pour League of Legends en 2025, mais ce n'était pas vrai...

Guides

à découvrir

League of Legends : Tier List des champions en Saison 13
Guide pour Ahri Mid en S13
Guide pour Ashe ADC en S13