El apagón de la red de AT&T en febrero se produjo por un error de configuración ¿en serio?

La semana pasada el mundo entró en modo apocalíptico con un error en la actualización de CrowdStrike ¿va a ser esto una tendencia?

La semana pasada, un error en una actualización de la empresa de seguridad CrowdStrike provocó una interrupción masiva en los sistemas Windows a nivel mundial, afectando a hospitales, aeropuertos y servicios de emergencia. Dicho incidente puso de manifiesto una tendencia preocupante donde no solo los ciberataques, sino también las fallas en actualizaciones de software, pueden causar interrupciones significativas en infraestructuras críticas. En este contexto, cinco meses después del gran apagón en la red de AT&T, la Comisión Federal de Comunicaciones (FCC, por sus siglas en inglés) publica un informe detallando las causas y efectos de esa interrupción.

El 22 de febrero de 2024, AT&T Mobility sufrió una interrupción de servicio inalámbrico que duró al menos doce horas y afectó a más de 125 millones de dispositivos en todo Estados Unidos, Puerto Rico y las Islas Vírgenes. La interrupción bloqueó más de 92 millones de llamadas de voz e impidió más de 25.000 llamadas al 911, afectando también a los usuarios de FirstNet, la red dedicada a la seguridad pública.

El informe de la FCC señala que la interrupción fue causada por un error en la configuración de un equipo de red implementado durante una ventana de mantenimiento nocturno rutinario. Tres minutos después de la implementación, la red de AT&T entró en “modo de protección” para evitar un impacto mayor en otros servicios, desconectando todos los dispositivos de la red. La restauración completa del servicio tomó al menos 12 horas debido a la congestión en los sistemas de registro de dispositivos de AT&T, causada por la alta demanda de re-registro de dispositivos en la red.

La FCC critica en su informe la falta de adherencia a los procedimientos internos de AT&T, la ausencia de revisión por pares, la insuficiencia de pruebas post-instalación y de laboratorio, y la falta de salvaguardias adecuadas. Estos factores contribuyeron a la magnitud y duración de la interrupción. La falta de controles específicos en los elementos de la red descendente también fue un factor crucial, ya que no pudieron mitigar el error de configuración, lo que llevó a la desconexión masiva de dispositivos.

Durante la interrupción, AT&T dijo haber priorizado la restauración de los dispositivos e infraestructura de FirstNet sobre los usuarios comerciales y residenciales. Sin embargo, la congestión debido al alto volumen de intentos de registro de dispositivos prolongó la recuperación, dice el informe de la FCC. A pesar de las medidas tomadas para mitigar los retrasos en el registro, algunos usuarios continuaron experimentando problemas de conexión durante varias horas después de que se normalizó el registro.

En respuesta a la interrupción, AT&T implementó controles técnicos adicionales y revisó sus procedimientos internos para evitar futuras interrupciones. La compañía también realizó trabajos forenses continuos para fortalecer la robustez y resiliencia de la red. La FCC, por su parte, subraya la importancia de que los operadores de redes móviles sigan las mejores prácticas de la industria, implementen controles adecuados para mitigar riesgos y estén preparados para responder rápidamente ante interrupciones.

Este incidente resalta la vulnerabilidad de las infraestructuras de telecomunicaciones a fallos técnicos y la necesidad de mantener sistemas de red resilientes y procedimientos rigurosos para asegurar la continuidad del servicio. La FCC planea emitir un Aviso Público recordando a los proveedores de servicios la importancia de adherirse a las mejores prácticas aceptadas por la industria y remite el asunto a la Oficina de Cumplimiento para una posible investigación de violaciones de las reglas de la Comisión.

Tu opinión es importante ¿Qué te ha parecido este contenido?

3 0
Cuenta con más de 22 años de experiencia cubriendo el sector de las telecomunicaciones para América Latina. El Sr. Junquera ha viajado constantemente alrededor del mundo cubriendo los eventos de mayor relevancia para la industria en América, Europa y Asia. Su experiencia académica incluye un BA en periodismo escrito por la Universidad de Suffolk en Boston, MA, y un Master en Economía Internacional en la misma institución.

Recuperar contraseña

Por favor ingrese su nombre de usuario o dirección de correo electrónico. Recibirá un enlace para crear una nueva contraseña por correo electrónico.