Actualités / Jeux

Guild Wars 2 donne un compte rendu technique complet des restaurations de serveur de l’année dernière

Guild Wars 2 donne un compte rendu technique complet des restaurations de serveur de l'année dernière

Guild Wars 2 le studio ArenaNet a fait l’objet de nombreux regards secondaires au cours des dernières années, se forgeant une réputation de studio avec un côté technique désordonné et opaque et un côté leadership désordonné et opaque – et les licenciements massifs en 2019 n’ont pas aidé. Plus tôt ce mois-ci, cependant, la société a finalement admis publiquement qui dirigeait le studio et Guild Wars 2 depuis le départ de Mike O’Brien et le départ furtif de Mike Zadorojny fin 2019. Et maintenant, nous avons un blog de développement technique inhabituellement détaillé de la part de l’équipe de plate-forme Robert Neckorcuk, nous donnant encore plus d’espoir que la revitalisation d’ArenaNet inclut une réinitialisation de son image publique et transparence.

Neckorcuk donne un compte rendu complet d’une journée particulièrement sombre dans l’histoire du jeu pour les joueurs en mai 2020. Vous vous souviendrez peut-être que c’était le mois où le mégaserveur de l’UE a été annulé et a coûté aux joueurs une quantité importante d’argent et de temps de jeu, qui pour Guild Wars 2 était un incident extrêmement rare. ArenaNet a ensuite déménagé pour indemniser les joueurs, mais c’était un peu un gâchis, car les joueurs se plaignaient des cadeaux de compensation et des incitations mixtes.

Neckorcuk approfondit beaucoup plus ce qui s’est passé dans les coulisses au cours de ces 20 heures, en commençant par la mise à jour de la semaine précédente, un problème de base de données malveillante et (sans blague) les pilotes qui ont tous contribué à provoquer et à aggraver le désastre en cascade. Il détaille également l’ensemble du processus par lequel le studio identifie les problèmes, les résout, remet les hamsters en marche et prévient les problèmes à l’avenir. Et vous avez peut-être remarqué que ce genre de temps d’arrêt ne s’est plus reproduit.

« Le changement le plus important pour nos bases de données a été d’augmenter les alertes sur les métriques clés de la base de données, et pas seulement sur les métriques système telles que le processeur ou l’espace disque dur. Pour nos opérations en direct, nous avons ajouté un certain nombre d’alertes dans un outil tiers afin d’améliorer notre temps de réponse pour les problèmes futurs. Et pour les opérations générales, nous avons amélioré la tenue des registres de notre infrastructure AWS, en suivant désormais plus que le type d’instance. Nos rapports incluent désormais les types d’instances, la génération, les pilotes et les types de stockage. Nous avons construit un package commun à installer sur tous les nouveaux serveurs qui inclut des versions de pilotes spécifiques. Tous les futurs plans de migration mettront à jour ce package commun, garantissant que nous ne répéterons pas ce problème. Nous avons terminé la migration de toutes les instances de base de données restantes et plus, offrant des performances plus élevées pour un service amélioré. Au cours des quatorze derniers mois, nous avons enregistré une disponibilité de 99,98 %, avec seulement cinq interruptions de service mineures ayant un impact sur les connexions des utilisateurs.

Si c’est le nouveau ArenaNet… nous l’aimons.

Publicité