Falla masiva de AWS deja fuera de servicio a Alexa, Fortnite, Snapchat y decenas de plataformas: el epicentro está en la región US-EAST-1

La mañana de este lunes 20 de octubre ha comenzado con una sacudida para medio Internet: Amazon Web Services (AWS) sufre una caída de gran alcance que ha interrumpido el funcionamiento de Amazon, Alexa, Snapchat, Fortnite, Epic Games Store y Epic Online Services, ChatGPT, Prime Video, Perplexity, Airtable, Canva, Duolingo, Zoom, la app de McDonald’s, Roblox y Clash Royale, entre otros servicios. El panel de estado de AWS reconoce “aumento de tasas de error y latencias” en US-EAST-1 (N. Virginia) —la región más concurrida del proveedor— y afirma estar trabajando para mitigar el incidente y determinar su causa raíz.

Según el registro interno de la nube de Amazon, los problemas se detectaron a las 03:11 ET (09:11 en la España peninsular) con un primer parte técnico que prometía una actualización “en 45 minutos”. En paralelo, a las 08:40 (hora peninsular) comenzaron a acumularse los reportes de caída en portales como DownDetector, mientras en foros y redes sociales miles de usuarios confirmaban que Alexa no respondía a peticiones ni ejecutaba rutinas —incluidas alarmas preconfiguradas— y que juegos y apps populares eran inaccesibles o funcionaban con errores intermitentes. El alcance es global, aunque el impacto varía por regiones y por dependencia de cada servicio respecto a la infraestructura afectada.

Perplexity está caído ahora mismo. La causa raíz es un problema de AWS. Estamos trabajando para resolverlo”, reconoció en X el consejero delegado de Perplexity, Aravind Srinivas.

Qué está fallando y por qué se nota tanto

AWS describe el incidente como un aumento de errores y latencias que afecta a múltiples servicios en US-EAST-1. Aunque se trate “solo” de una región, su peso desproporcionado en la nube de Amazon explica el efecto dominó: muchas empresas alojan cargas en N. Virginia por histórico, coste, latencia o disponibilidad de servicios; además, ciertos planos de control y dependencias internas (autenticación, colas, DNS internos, orquestación) utilizan componentes multicliente que, al degradarse, ripplean hacia otras regiones. Es la razón de que hoy servicios ubicados en Europa también estén resintiendo la caída con inicios de sesión fallidos, cargas parciales o picos de latencia.

En la práctica, el usuario se topa con cuatro síntomas frecuentes:

  1. Páginas que no cargan o devuelven códigos 5xx.
  2. APIs que responden de forma errática o caducan.
  3. Imposibilidad de subir/descargar contenido (imágenes, adjuntos).
  4. Servicios “inteligentes” —asistentes de voz, recomendaciones, automatizaciones— silenciados.

Entre las plataformas afectadas figuran gigantes del entretenimiento y la comunicación —Fortnite, Snapchat—, asistentes de vozAlexa—, aplicaciones corporativas (Airtable, Canva), servicios de IA (ChatGPT, Perplexity) y aplicaciones de consumo (Prime Video, McDonald’s). La popularidad de AWS —utilizado por Netflix, Spotify, Reddit o Airbnb, entre muchos otros— multiplica el calado de cualquier fallo.

Cronología conocida del incidente

  • 03:11 ET (09:11 en España peninsular). El panel de estado de AWS reporta un incidente en US-EAST-1 con errores y latencias elevadas.
  • 03:51 ET. Amazon publica un parte: “Estamos trabajando para mitigar el problema y entender la causa raíz. Habrá actualización en 45 minutos o antes si hay nueva información”.
  • 08:40 (hora peninsular). Usuarios en España y otros países de Europa comienzan a notar fallos en conectividad y carga de servicios dependientes de AWS.
  • Mañana-mediodía (Europa). Continúan las disrupciones con comportamientos intermitentes según servicio y región. La causa no se ha confirmado oficialmente y no hay ETA para la restauración completa.

No es la primera vez: el precedente de US-EAST-1

La región US-EAST-1 ha protagonizado incidentes sonados en los últimos años. 2020, 2021 y 2023 registraron caídas con disrupciones generalizadas durante varias horas. El patrón —afectación en N. Virginia con efectos visibles a escala global— ha llevado a muchos equipos de ingeniería a repensar su arquitectura para no concentrar planos de control y datos críticos en un único punto de fallo.

Cómo afecta en España y Europa

La fotografía de la mañana muestra un mapa desigual: algunos servicios funcionan con normalidad, otros fallan al iniciar sesión o al subir contenido, y otros directamente no cargan. El impacto puede cambiar por minutos conforme AWS mitiga componentes internos o redistribuye carga. También influye cómo y dónde está desplegada cada plataforma: si una compañía usa multi-región real, es más probable que degrade la experiencia sin quedar totalmente fuera de servicio.

Qué dicen las empresas afectadas

Además del mensaje de AWS, varios equipos han reconocido públicamente la dependencia del proveedor. Perplexity fue explícita en X. Estudios de juegos, plataformas de diseño y aplicaciones de productividad han publicado avisos en sus status pages y redes, algunos desactivando funciones mientras esperan la normalización.

El caso de Alexa es paradigmático: al ser un servicio cloud-first, la caída de AWS ha dejado inoperativas peticiones cotidianas como encender luces, lanzar rutinas o consultar el tiempo. En la parte empresarial, organizaciones que usan SaaS montados sobre Amazon están informando de lentitud, errores intermitentes y fallos de autenticación.

Por qué “cae Internet” cuando cae un hiperescala

La computación en la nube permite alquilar recursos (cómputo, almacenamiento, bases de datos, mensajería) en vez de comprarlos. Esa economía de escala —la gran promesa del cloud— introduce, a su vez, concentración: si demasiados servicios dependen de un mismo plano (por ejemplo, US-EAST-1 y componentes comunes), un incidente puede propagarse. Las buenas prácticas recomiendan multi-AZ (múltiples zonas dentro de una región) y, cuando el negocio lo justifica, multi-región o incluso multi-cloud. No todas las plataformas, sin embargo, implementan ese diseño, ya sea por coste, complejidad o legado.

Qué pueden hacer ahora usuarios y empresas

Usuarios finales

  • Comprobar la página de estado del servicio que se está usando (y la de AWS).
  • Evitar reinstalar apps o borrar datos si el problema es del proveedor.
  • Repetir la acción más tarde: la intermitencia puede jugar a favor conforme avanza la mitigación.

Equipos de TI

  • No introducir cambios de configuración urgentes en mitad del incidente salvo que exista una ruta de mitigación clara (por ejemplo, conmutar a otra región ya preparada).
  • Si la arquitectura lo permite, migrar tráfico a regiones sanas (multi-región activo/activo o activo/pasivo).
  • Comunicar a clientes y empleados el estado y los tiempos estimados; establecer colas de tareas que se reintentarán cuando el proveedor recupere servicio.
  • Revisar tras la normalización: ¿qué dependencias críticas estaban monorregión?, ¿qué alarmas se dispararon?, ¿qué SLA/SLO se incumplieron?

Lo que se sabe (y lo que no)

  • Confirmado: US-EAST-1 sufre errores y latencias elevados en múltiples servicios de AWS; hay impacto global de distinta intensidad.
  • Reportado: plataformas como Alexa, Fortnite, Snapchat, Prime Video, Perplexity, Airtable, Canva, Duolingo, Zoom, Roblox, Clash Royale, ChatGPT y Epic se han visto afectadas total o parcialmente.
  • No confirmado: causa raíz y tiempo estimado de restauración completa (AWS continúa la investigación).

Lecciones que probablemente dejará esta caída

  1. US-EAST-1 no puede ser un “todo en uno”. Centralizar control y datos en N. Virginia es conveniente, pero arriesgado.
  2. Multi-AZ no siempre basta. Cuando el fallo afecta a componentes transversales, tener varias Zonas de Disponibilidad en una misma región no evita la interrupción.
  3. Multi-región y “chaos-gamedays”. Ensayar failovers y degradaciones en frío (y en caliente) es tan importante como escribir el runbook.
  4. Transparencia. La comunicación temprana y los partes periódicos son clave para reducir la incertidumbre de clientes y usuarios.

Preguntas frecuentes (FAQs)

¿Qué es exactamente US-EAST-1 y por qué su caída impacta a tantos servicios?
US-EAST-1 es la región de AWS en N. Virginia y una de las más concurridas por histórico, coste y catálogo de servicios. Muchas plataformas alojan allí parte del plano de control o cargas clave. Por eso, un incidente en esta región puede propagarse más allá de sus límites y degradar servicios en otras zonas.

¿Qué servicios se han visto afectados por la caída de AWS hoy?
El incidente ha afectado total o parcialmente a Amazon, Alexa, Prime Video, Snapchat, Fortnite, Epic Games Store/Epic Online Services, ChatGPT, Perplexity, Airtable, Canva, Duolingo, Zoom, Roblox, Clash Royale, entre otros. La intensidad varía por región y por dependencia de cada plataforma respecto a US-EAST-1.

¿Cuánto puede durar una caída de AWS y qué puede hacer mi empresa mientras tanto?
La duración depende de la causa y del alcance. Hay precedentes en 2020, 2021 y 2023 con varias horas de disrupción. Mientras tanto, conviene no realizar cambios arriesgados, comunicar el estado a usuarios, conmutar a otra región si existe esa capacidad y registrar métricas para el post-mortem.

¿Cómo reducir el impacto de futuras caídas de AWS (o de cualquier hiperescala)?
Adoptando multi-AZ y, para servicios críticos, multi-región real; separando planos de control/datos, usando colas idempotentes y reintentos con backoff; ensayando failovers y gamedays; y, si el negocio lo exige, valorando multi-cloud y CDN/DNS con conmutación controlada.


Nota: Esta cobertura se basa en datos públicos del panel de estado de AWS, comunicados de las compañías afectadas y reportes de usuarios en tiempo real. La información puede actualizarse a medida que Amazon publique nuevos detalles o la situación evolucione.

vía: Downdetector

encuentra artículos

newsletter

Recibe toda la actualidad del sector tech y cloud en tu email de la mano de RevistaCloud.com.

Suscripción boletín

LO ÚLTIMO

×