(CNNTech) – El incidente que hizo que algunos sitios web estuvieran por fuera de operación esta semana fue el resultado de un error humano.
Amazon publicó una explicación sobre el servicio S3 —interrumpido el martes—, que es parte de Amazon Web Services (AWS) y que proporciona alojamiento para cientos de miles de sitios web y aplicaciones.
Resulta que fue un error tipográfico.
En una declaración el jueves, Amazon dijo que un empleado de su equipo S3 estaba trabajando en un problema con el sistema de facturación y pretendía quitar un pequeño número de servidores fuera de línea, pero ingresaron incorrectamente en el comando y eliminaron un conjunto mucho mayor de servidores.
Amazon está “haciendo varios cambios” a su sistema para evitar un evento similar en el futuro. A saber, “la herramienta usada permitió que mucha capacidad fuera eliminada rápidamente.”
Según Synergy Research Group, AWS posee el 40% del mercado de servicios en la nube, lo que significa que es responsable de la operatividad de grandes franjas de sitios web populares. Así que si AWS se cae, se lleva consigo un gran número de empresas, aplicaciones y medios.
Es por eso que tantos sitios lucharon por operar con capacidad lenta o reducida durante la interrupción del martes. Algunas organizaciones de noticias no pudieron publicar historias y el uso compartido de archivos estaba deshabilitado en la aplicación de chat corporativa Slack. Otros sitios afectados incluyen GitHub, Trello y Venmo. Le tomó a Amazon casi cuatro horas para resolver el problema.
“Aunque estamos orgullosos de nuestro largo historial de disponibilidad con Amazon S3, sabemos lo crítico que es este servicio para nuestros clientes, sus aplicaciones y usuarios finales y sus negocios”, dijo la compañía.
“Haremos todo lo posible para aprender de este incidente y usarlo para mejorar aún más nuestra disponibilidad”.