Kyndryl lleva la IA agéntica a la prevención de caídas críticas de TI

Kyndryl ha presentado una nueva capacidad de inteligencia artificial agéntica dentro de Kyndryl Bridge, su plataforma abierta de integración y operaciones TI, con una promesa que resume bien hacia dónde se mueve el mercado: pasar de reaccionar ante incidencias a detectar señales tempranas antes de que se conviertan en una caída con impacto en el negocio.

La compañía afirma que esta función patentada ya está disponible para los clientes de Kyndryl Bridge y que se apoya en agentes de IA capaces de ayudar en el análisis de causa raíz, correlacionar señales de observabilidad y proponer acciones antes de que una anomalía acabe afectando a aplicaciones, infraestructura o servicios críticos. En entornos híbridos, multicloud y con múltiples proveedores, ese salto de la detección manual a la prevención asistida por IA puede marcar una diferencia importante.

La novedad llega en un momento en el que muchas empresas tienen infraestructuras más distribuidas que nunca. Aplicaciones heredadas, cloud público, plataformas privadas, contenedores, redes, mainframe, bases de datos, SaaS y servicios gestionados conviven en operaciones que no siempre están bien observadas de extremo a extremo. Cuando algo falla, encontrar la causa real puede llevar horas, días o incluso semanas, especialmente si el problema se propaga entre capas.

De apagar fuegos a anticipar patrones de fallo

Kyndryl Bridge ya era una plataforma orientada a integrar datos, procesos y automatización en operaciones TI. Con esta nueva capacidad, Kyndryl quiere reforzar la parte predictiva: detectar condiciones que suelen preceder a una caída, validar relaciones causales y ayudar a los equipos a intervenir antes de que el incidente escale.

Según la compañía, Kyndryl Bridge genera más de 16 millones de insights de IA al mes y da soporte a más de 1.400 clientes. La nueva capacidad trabaja sobre más de 200.000 dispositivos de clientes y está pensada para identificar patrones que combinan ralentizaciones de aplicaciones, contención de infraestructura, cambios de configuración y eventos operativos.

El enfoque es relevante porque muchos incidentes graves no empiezan como una avería evidente. Suelen nacer como señales débiles: una latencia que sube, un cambio de configuración, una saturación parcial, un servicio que responde más lento, una cola que crece, una dependencia externa inestable o un patrón que se repite tras despliegues similares. Vistos de forma aislada, esos datos pueden parecer ruido. Correlacionados, pueden anticipar un problema.

Kyndryl sostiene que su nueva función puede reducir de forma drástica el tiempo necesario para completar análisis de causa raíz en incidentes graves, pasando de informes que antes podían tardar semanas a análisis completados en horas. La compañía matiza que sus expertos revisan y validan los insights generados para aportar contexto operativo y asegurar que encajan con el entorno del cliente.

Ese punto es importante. La IA agéntica en operaciones TI no puede actuar como una caja negra sin supervisión. En infraestructuras críticas, una recomendación incorrecta puede ser tan peligrosa como una incidencia no detectada. Por eso el equilibrio entre automatización, validación humana y evidencia técnica será decisivo para que este tipo de plataformas gane confianza.

AIOps entra en una fase más agéntica

La propuesta de Kyndryl se inscribe en la evolución de AIOps, una categoría que lleva años prometiendo reducir ruido, correlacionar alertas y mejorar la gestión de incidentes. La diferencia ahora está en el uso de agentes de IA capaces de razonar sobre señales, asistir en diagnósticos, priorizar riesgos y, en algunos casos, iniciar acciones guiadas por políticas.

La compañía habla de detección predictiva y prevención de fallos, no solo de observabilidad. Esto implica pasar de “algo ha ocurrido” a “estas condiciones suelen terminar en un problema si no se actúa”. Para grandes organizaciones, ese cambio puede tener impacto directo en disponibilidad, costes de mantenimiento, satisfacción de usuario y continuidad operativa.

Kyndryl afirma que Kyndryl Bridge ha demostrado reducciones de incidentes TI de hasta el 50 % y que genera un ahorro agregado de 3.000 millones de dólares anuales para clientes por eventos evitados y costes de mantenimiento planificado. También asegura que esta capacidad gestiona detección temprana a escala sobre más de 10 millones de incidentes anuales y que, en determinados clientes, ha mostrado reducciones superiores al 90 % en caídas de producción de misión crítica.

Son cifras llamativas y deben leerse como resultados comunicados por la propia empresa, no como una garantía automática para cualquier despliegue. La eficacia dependerá del grado de integración, calidad de los datos, cobertura de observabilidad, madurez operativa, automatización existente y capacidad del cliente para actuar sobre las recomendaciones. Una plataforma puede detectar patrones, pero si los equipos no tienen procesos claros para intervenir, el beneficio se reduce.

Por qué importa en entornos híbridos y multicloud

La prevención de caídas se ha vuelto más difícil porque las arquitecturas empresariales son más heterogéneas. Una aplicación crítica puede depender de un sistema legacy, una base de datos en cloud, una red privada, un proveedor SaaS, una API externa y varios componentes de seguridad. Cuando se degrada el servicio, cada equipo suele mirar su propia capa. El resultado puede ser una investigación fragmentada y lenta.

Kyndryl intenta resolver ese problema con observabilidad unificada y correlación entre dominios. Si la plataforma puede relacionar eventos de infraestructura, cambios recientes, comportamiento de aplicaciones y señales de rendimiento, el diagnóstico deja de depender tanto de reuniones entre equipos que intercambian pantallazos y logs.

La IA agéntica puede aportar velocidad, pero también plantea preguntas de gobierno. Qué puede hacer un agente. Qué acciones requieren aprobación humana. Cómo se registran las decisiones. Qué datos analiza. Cómo se evita que recomiende cambios arriesgados. Cómo se gestionan entornos regulados. Kyndryl ya había presentado en abril Agentic Service Management y capacidades de confianza digital para gobernar agentes de IA en workflows TI, lo que sitúa esta nueva función dentro de una estrategia más amplia.

Este punto será clave para sectores como banca, seguros, industria, sanidad, administración pública o telecomunicaciones. En esos entornos, prevenir una caída no es solo una mejora operativa. Puede evitar pérdidas económicas, incumplimientos regulatorios, interrupciones de servicio y daños reputacionales.

La prevención será una métrica de negocio

El anuncio de Kyndryl confirma que la gestión de operaciones TI está dejando de medirse solo por tiempo medio de reparación. El MTTR seguirá siendo importante, pero las organizaciones quieren reducir el número de incidentes que llegan a producción, anticipar degradaciones y evitar ventanas de mantenimiento innecesarias.

Para los CIOs, esto cambia la conversación. Una plataforma de operaciones ya no debe limitarse a mostrar dashboards o alertas. Tiene que ayudar a decidir, priorizar y prevenir. Si la IA consigue explicar por qué una anomalía importa, qué capas están relacionadas y qué acción reduce el riesgo, puede liberar tiempo de equipos técnicos saturados y mejorar la continuidad del negocio.

La dificultad está en separar la automatización útil del ruido sofisticado. Muchas herramientas prometen IA, pero no siempre aportan evidencias accionables. Kyndryl intenta diferenciarse por escala, por su base instalada y por la combinación de agentes, análisis de causa raíz y validación experta. La prueba real estará en los resultados sostenidos de los clientes y en la capacidad de integrar esta inteligencia en procesos operativos diarios.

La dirección del mercado parece clara: las empresas no quieren enterarse de un fallo cuando ya afecta al cliente. Quieren señales tempranas, contexto y capacidad de respuesta antes de que el incidente se convierta en caída. La IA agéntica aplicada a operaciones TI no eliminará todos los problemas, pero puede reducir el tiempo perdido en investigar síntomas y ayudar a que los equipos trabajen sobre causas reales.

En infraestructuras cada vez más complejas, la prevención puede convertirse en una ventaja competitiva. No por ser más vistosa que una nueva aplicación de IA generativa, sino porque mantiene funcionando lo que sostiene al negocio.

Preguntas frecuentes

¿Qué ha anunciado Kyndryl?
Kyndryl ha presentado una capacidad de IA agéntica en Kyndryl Bridge para detectar y prevenir riesgos TI antes de que se conviertan en caídas con impacto empresarial.

¿Qué hace Kyndryl Bridge?
Es una plataforma abierta de integración y operaciones TI que usa IA, automatización y observabilidad para ayudar a gestionar entornos híbridos, multicloud y multi proveedor.

¿Qué diferencia hay entre detectar y prevenir incidentes?
Detectar significa identificar que algo falla o se degrada. Prevenir implica reconocer patrones que suelen preceder a una caída y actuar antes de que afecte al negocio.

¿La IA actúa sola en entornos críticos?
Kyndryl indica que sus expertos revisan y validan los insights generados para asegurar contexto operativo y alineación con los entornos de los clientes.

vía: kyndryl

encuentra artículos

newsletter

Recibe toda la actualidad del sector tech y cloud en tu email de la mano de RevistaCloud.com.

Suscripción boletín

LO ÚLTIMO

Las últimas novedades de tecnología y cloud

Suscríbete gratis al boletín de Revista Cloud. Cada semana la actualidad en tu buzón.

Suscripción boletín
×