Un fallo global en internet afectó este martes 8 de junio de 2021 a numerosas páginas, entre otras, plataformas de medios de comunicación. Sitios como The New York Times, Twitch, Financial Times, Amazon o Reddit están sufriendo problemas de acceso.
Fastly, la plataforma ‘edge cloud’ responsable de la caída global, ha dado más información sobre el problema y ha asegurado que fue causado por un error en el ‘software’ de la empresa que fue actualizado hace casi un mes.
En el centro de la caída está Fastly y su CDN (‘content delivery network’, o red de entrega de contenidos), una herramienta que actúa como agente de movilidad y permite el acceso a webs en todo el mundo y sin esperas mediante nodos, sin importar en qué país estén sus servidores.
Este martes por la noche, el vicepresidente sénior de Ingeniería e Infraestructura de Fastly, Nick Rockwell, ha publicado un comunicado en el que ha proporcionado más detalles sobre el problema de servicio del 8 de junio.
Rockwell explica que la compañía detectó el error en solo un minuto, y procedió a identificar la causa y deshabilitar la configuración que generó los problemas. En 49 minutos, el 95 por ciento de la red de Fastly ya funcionaba de manera normal.
Fastly ha explicado que el problema se originó en un despliegue de ‘software’ que llevó a cabo la empresa el 12 de mayo, que contenía un error que podía activarse «por una configuración de cliente específica en circunstancias específicas».
Un cliente de Fastly llevó a cabo un cambio de configuración que, aunque la compañía asegura que fue válido, provocó el error en el código vulnerable introducido casi un mes antes. Como resultado, el 85 por ciento de la red de Fastly devolvía errores a los internautas que intentaban usar los servicios.
A las 19:25 horas de la tarde Fastly ya había lanzado una solución permanente para el problema de ‘software’, y la compañía se ha comprometido a desplegar este parche «de la manera más rápida y segura posible», según Rockwell.
Fastly llevará a cabo también una investigación completa sobre las prácticas que llevó a cabo durante el incidente, así como para determinar por qué no detectó en sus procesos de revisión el error que ocasionó la caída global. También evaluará formas de mejorar su tiempo de solución de problemas.