La caída de un servicio digital ya no es un problema técnico que pueda encerrarse en el departamento de IT. Cada minuto sin servicio afecta a ingresos, clientes, reputación, cumplimiento normativo y valor bursátil. La última investigación de Splunk, compañía de Cisco, pone cifras a esa realidad: el coste agregado del downtime no planificado para las empresas del Global 2000 alcanza ya los 600.000 millones de dólares al año, un 50 % más que hace solo dos años.
El estudio, elaborado junto a Oxford Economics a partir de 2.000 ejecutivos de grandes compañías en 20 países, describe un cambio de fondo. La disponibilidad digital se ha convertido en un asunto de negocio, no solo de infraestructura. Una caída prolongada puede provocar pérdida de ventas, fuga de clientes, multas regulatorias, costes de soporte, pagos por ransomware y una erosión de marca que no se recupera en días.
Cuando una caída deja de ser “un problema de sistemas”
Según el informe, una organización pierde de media 95 millones de dólares al año en ingresos por interrupciones no planificadas, casi el doble que en 2024. El coste medio del downtime se sitúa ya en 15.000 dólares por minuto. Estas cifras varían por sector y tamaño de empresa, pero muestran la magnitud del problema en un entorno donde casi todos los procesos críticos dependen de aplicaciones, APIs, nubes públicas, SaaS, redes, sistemas de identidad y plataformas de datos.
El impacto tampoco termina cuando vuelve el servicio. Cisco y Splunk señalan que las compañías sufren de media una caída del 3,4 % en bolsa tras un evento de downtime. En paralelo, el 81 % de los líderes tecnológicos cita la pérdida de clientes como consecuencia de las interrupciones, y un dato especialmente incómodo: el 47 % reconoce que, a menudo o muy a menudo, son los propios clientes los primeros en detectar degradaciones o caídas del servicio.
| Indicador del informe de Splunk/Cisco | Dato |
|---|---|
| Coste agregado anual del downtime en Global 2000 | 600.000 millones de dólares |
| Incremento frente a 2024 | 50 % |
| Pérdida media anual de ingresos por organización | 95 millones de dólares |
| Coste medio por minuto de downtime | 15.000 dólares |
| Caída media de cotización tras un evento | 3,4 % |
| Ejecutivos que citan pérdida de clientes como consecuencia | 81 % |
| Clientes que detectan antes degradaciones o caídas, según líderes tech | 47 % |
| Coste medio de pagos por ransomware | 40 millones de dólares |
| Multas regulatorias medias por organización | 51 millones de dólares |
La lectura empresarial es clara: la resiliencia digital ya no puede medirse solo en uptime técnico. Una aplicación puede volver a funcionar, pero el daño comercial, financiero y reputacional puede seguir abierto durante semanas. De hecho, casi el 20 % de los profesionales de marketing consultados afirma que la recuperación de la salud de marca tras una interrupción puede llevar un trimestre completo.
Seguridad, ransomware y deuda tecnológica
El informe también muestra que la frontera entre seguridad y disponibilidad se está difuminando. Un 36 % de los responsables de seguridad admite que el downtime se clasifica con frecuencia como un problema de IT, una confusión que puede dar ventaja a los atacantes si detrás de la caída hay una intrusión, un ataque de ransomware o un abuso de servicios externos.
La falta de contexto compartido complica la respuesta. Solo el 38 % de los ejecutivos tecnológicos afirma identificar de forma consistente la causa raíz de un incidente de downtime. En entornos híbridos y multicloud, con aplicaciones SaaS, integraciones de terceros y dependencias entre sistemas, encontrar el origen exacto de una caída puede ser tan difícil como resolverla.
El ransomware aparece como uno de los costes directos más duros. Los pagos medios se han casi triplicado desde 2024 y alcanzan los 40 millones de dólares. A eso se suman posibles multas regulatorias, que el informe sitúa en una media de 51 millones por organización. El daño no procede solo del rescate o de la interrupción: también del posible incumplimiento de obligaciones de seguridad, privacidad, continuidad operativa o notificación.
La deuda tecnológica agrava el problema. Infraestructura heredada, sistemas sin parchear, herramientas que no se comunican entre sí, falta de visibilidad y procesos manuales aumentan la probabilidad de fallos y alargan la recuperación. En un negocio digital, cada minuto que se tarda en entender qué ha pasado eleva el coste.
La IA ayuda, pero también introduce nuevos riesgos
Las empresas están recurriendo a la inteligencia artificial para mejorar la respuesta ante incidentes. El informe indica que las organizaciones gastan una mediana anual de 24,5 millones de dólares en herramientas de IA orientadas a prevenir o responder al downtime. Los usos más claros están en triaje de incidentes, análisis de causa raíz, automatización de seguridad y observabilidad.
El enfoque más maduro no consiste en sustituir a los equipos humanos, sino en crear colaboración entre personas y agentes de IA. La IA puede analizar logs, métricas y trazas con rapidez, detectar patrones anómalos, priorizar alertas y proponer acciones. Pero sigue necesitando supervisión, contexto de negocio y límites claros. El propio estudio señala que el 68 % de los líderes tecnológicos está preocupado por el comportamiento impredecible de sus agentes de IA.
La paradoja es evidente. El 56 % de los usuarios afirma que la IA ha reducido su riesgo general, pero todos los líderes tecnológicos encuestados reconocen que su organización ha experimentado algún tipo de downtime relacionado con IA. Esto no invalida la utilidad de la tecnología, pero confirma que la IA también se convierte en una nueva dependencia crítica. Si un agente automatiza una respuesta equivocada, interpreta mal una señal o actúa sin suficiente gobierno, puede acelerar un incidente en lugar de contenerlo.
Las organizaciones que Splunk clasifica como expertas en flujos de trabajo y triaje con IA muestran mejores resultados. El 74 % evitó tener que revelar públicamente una brecha de datos el año pasado, frente al 54 % de las compañías no expertas. Además, estas organizaciones son casi tres veces más propensas a afirmar que nunca han perdido clientes por downtime: un 42 % frente al 15 %.
La observabilidad se convierte en prioridad de negocio
Uno de los mensajes más fuertes del informe es la necesidad de ver toda la cadena de dependencia digital. Entre las organizaciones con menores costes de downtime, el 98 % considera la visibilidad de extremo a extremo muy o extremadamente importante para reducir incidentes. No se trata solo de monitorizar servidores. Hace falta comprender cómo se relacionan aplicaciones, APIs, bases de datos, identidades, redes, servicios cloud, proveedores SaaS y experiencia de usuario.
Por eso la observabilidad aparece como una de las prioridades de inversión. Tres de cada cuatro líderes de ITOps e ingeniería la sitúan como su principal área para mejorar la resiliencia de infraestructura, por delante incluso de actualizaciones tradicionales de hardware o centros de datos. La automatización también gana peso: el 66 % prioriza inversiones para reducir errores humanos, que siguen siendo una de las principales causas de interrupciones.
La seguridad se mueve en la misma dirección. El 85 % de los líderes tecnológicos prioriza automatización de seguridad impulsada por IA, mientras el 65 % invierte en observabilidad con IA para obtener información en tiempo real sobre sus entornos digitales.
La conclusión no es que las empresas necesiten más herramientas sin criterio. El propio Splunk advierte de que las organizaciones más resilientes no son las que acumulan más soluciones, sino las que alinean tecnología con resultados de negocio, dan contexto a sus equipos y diseñan sistemas capaces de absorber presión sin romperse.
El downtime ya no es una anomalía técnica. Es una prueba de madurez operativa. En un mundo de IA, cloud, APIs y servicios permanentemente conectados, la resiliencia se ha convertido en una forma de proteger ingresos, confianza y continuidad. Las compañías que sigan tratando las caídas como simples incidencias de IT llegarán tarde al problema. Las que las entiendan como riesgo empresarial tendrán más opciones de reducir tanto el impacto como el tiempo de recuperación.
Preguntas frecuentes
¿Qué es el downtime no planificado?
Es cualquier interrupción o degradación inesperada de un servicio digital, aplicación, infraestructura o sistema crítico que afecta al funcionamiento normal de una organización.
¿Cuánto cuesta el downtime a las grandes empresas?
Según el informe de Splunk y Cisco, el coste agregado anual para las empresas del Global 2000 asciende a 600.000 millones de dólares, con un coste medio de 15.000 dólares por minuto.
¿Por qué el downtime también es un problema de ciberseguridad?
Porque muchas interrupciones pueden estar relacionadas con ransomware, ataques a terceros, fallos de SaaS, robo de datos o incidentes mal clasificados como simples problemas de IT.
¿Puede la inteligencia artificial reducir las caídas?
Puede ayudar en triaje, detección de anomalías, automatización y análisis de causa raíz, pero también introduce nuevos riesgos si los agentes no están bien gobernados y supervisados.
vía: newsroom.cisco