Amazon a révélé ses conclusions sur la cause de la récente panne d’AWS qui a affecté les sites Web et les utilisateurs du monde entier.
Un large éventail de services Amazon tels que Prime Video, Alexa et Ring, ainsi que des clients de haut niveau tels que Facebook et Disney Plus, ont tous connu des temps d’arrêt ou des ralentissements importants en raison d’un problème dans une région AWS aux États-Unis qui a duré de nombreuses heures.
La société a maintenant terminé son enquête sur la panne, qui, selon elle, était due à une série d’événements inattendus visant initialement à renforcer ses services.
Sommaire
Panne d’AWS
« Une activité automatisée pour faire évoluer la capacité de l’un des services AWS hébergés sur le réseau AWS principal a déclenché un comportement inattendu de la part d’un grand nombre de clients à l’intérieur du réseau interne », a écrit AWS dans un article de blog.
« Cela a entraîné une forte augmentation de l’activité de connexion qui a submergé les périphériques réseau entre le réseau interne et le réseau AWS principal, entraînant des retards de communication entre ces réseaux. »
La société a déclaré avoir pris « plusieurs mesures » pour éviter que cet événement ne se reproduise, notamment une évaluation plus approfondie de ces activités de mise à l’échelle et le déploiement d’une configuration réseau supplémentaire.
AWS s’est également engagé à revoir la façon dont il suit et fournit des informations sur les pannes à venir, notant que « Nous comprenons que des événements comme celui-ci ont plus d’impact et sont plus frustrants lorsque les informations sur ce qui se passe ne sont pas facilement disponibles ».
La société a annoncé qu’elle allait désormais déployer « plusieurs améliorations » à ses services de support pour s’assurer qu’elle est en mesure de communiquer rapidement tout problème futur avec les clients, avec une mise à niveau devant être déployée au début de 2022.
« Enfin, nous tenons à nous excuser pour l’impact que cet événement a causé à nos clients », a conclu le blog. « Bien que nous soyons fiers de notre historique de disponibilité, nous savons à quel point nos services sont essentiels pour nos clients, leurs applications, leurs utilisateurs finaux et leurs entreprises. Nous savons que cet événement a eu un impact significatif sur de nombreux clients. Nous ferons tout notre possible. d’apprendre de cet événement et de l’utiliser pour améliorer encore plus notre disponibilité. »