Huawei presenta una infraestructura de datos completa para centros de IA

Nota de Prensa

Huawei ha presentado en París una nueva solución de infraestructura de datos para centros de datos de inteligencia artificial, una propuesta con la que la compañía china quiere reforzar su papel en una de las capas menos visibles, pero más determinantes, de la adopción empresarial de la IA: cómo se almacenan, preparan, recuperan, protegen y reutilizan los datos que alimentan modelos y agentes.

El anuncio se realizó durante el Huawei Innovative Data Infrastructure Forum 2026, celebrado el 21 de mayo, donde Yuan Yuan, vicepresidente de Huawei y presidente de la línea de productos de almacenamiento de datos de la compañía, defendió que la próxima etapa de la IA empresarial estará marcada por los datos. Su idea es clara: si las empresas quieren desplegar agentes, modelos y sistemas de inferencia a gran escala, no basta con comprar más GPU o aceleradores. También necesitan una arquitectura de datos pensada desde el principio para cargas de IA.

La propuesta de Huawei combina varios bloques: data lake, plataforma de datos para IA, gestión de memoria contextual, ingeniería de modelos, orquestación de recursos, creación de agentes y resiliencia de datos. Es una aproximación de pila completa que busca cubrir desde el almacenamiento físico hasta la operación de agentes empresariales.

El dato como cuello de botella de la IA empresarial

Durante los últimos dos años, buena parte de la conversación sobre inteligencia artificial se ha centrado en modelos, aceleradores y centros de datos. Pero la adopción real en empresas suele topar con un problema más básico: los datos no siempre están preparados para alimentar sistemas de IA de forma segura, rápida y fiable.

Una compañía puede tener años de información repartida entre sedes, aplicaciones, bases documentales, sistemas industriales, repositorios de imágenes, logs, vídeos, bases vectoriales y plataformas cloud. Convertir todo eso en conocimiento útil para agentes y modelos exige algo más que almacenamiento bruto. Hace falta importar datos multimodales, clasificarlos, hacerlos visibles, controlar su calidad, recuperarlos con baja latencia y protegerlos frente a manipulación, ransomware o uso indebido.

Huawei intenta responder a ese problema con su solución de infraestructura de datos para centros de IA. Según la compañía, la arquitectura debe planificarse alrededor de varios pilares: lagos de datos, plataformas de IA, potencia de cálculo, modelos, marcos de agentes y resiliencia. La lectura es relevante porque desplaza el foco desde el modelo hacia la base operativa que permite usarlo en producción.

En el bloque de data lake, Huawei destaca OceanStor Pacific Scale-Out Storage, con una densidad declarada de 11 PB en 2U. La cifra, presentada por la compañía, apunta a uno de los grandes retos de la IA: almacenar volúmenes enormes de datos sin disparar el espacio físico ni el coste total de propiedad. También incluye DME Omni-Dataverse, una solución de espacio de datos unificado para importar datos multimodales, entre sedes y en tiempo real, además de ofrecer visibilidad global y recuperación sobre grandes volúmenes de vectores.

Memoria contextual y caché KV: la batalla de la inferencia

Uno de los elementos más técnicos del anuncio es Context Memory Storage, o CMS, que Huawei presenta como una solución para clústeres de inferencia a gran escala. Su objetivo es crear un gran pool compartido de caché KV a escala de petabytes, compatible con potencia de cálculo heterogénea.

La caché KV es un componente básico en la inferencia de modelos de lenguaje. Permite conservar información intermedia generada durante el procesamiento de una conversación o tarea, de modo que el modelo no tenga que recalcularlo todo constantemente. En flujos con agentes, documentos largos o sesiones persistentes, esa memoria puede convertirse en una pieza crítica para reducir latencia y coste.

Huawei afirma que CMS puede reducir hasta un 90 % el tiempo hasta el primer token, conocido como TTFT. Conviene tratar la cifra como una métrica declarada por el fabricante, pendiente de validación según configuración y carga real. Aun así, el enfoque refleja bien hacia dónde se mueve el mercado: la inferencia ya no depende solo del acelerador, sino de cómo se gestiona memoria, contexto, caché, almacenamiento y red.

La compañía también ha presentado una plataforma de datos “3+1” para escenarios empresariales de inferencia. Integra aceleración de caché KV, una base de conocimiento con más del 95 % de precisión de recuperación, según Huawei, y un banco de memoria en evolución. Además, Unified Cache Manager permitiría coordinar esa memoria y mejorar la precisión de inferencia en un 30 %, siempre según los datos comunicados por la empresa.

Capa anunciada por Huawei	Función principal	Métrica destacada comunicada
OceanStor Pacific	Almacenamiento scale-out para data lake	11 PB en 2U
DME Omni-Dataverse	Espacio de datos unificado y recuperación vectorial	Búsqueda en cientos de miles de millones de vectores
Context Memory Storage	Pool compartido de caché KV	Hasta un 90 % menos de TTFT
Plataforma 3+1	Caché, conocimiento y memoria para inferencia	Más del 95 % de precisión de recuperación
Unified Cache Manager	Gestión de caché y memoria	Hasta un 30 % más de precisión
ModelEngine Nexent	Creación de agentes por lenguaje natural	Hasta un 80 % menos de tiempo de despliegue

Modelos y agentes como parte de la infraestructura

Huawei no limita la propuesta al almacenamiento. La compañía incorpora ModelEngine, una capa pensada para facilitar el uso de modelos, el despliegue con un clic y la adaptación sin código a nuevos modelos. También habla de particionamiento fino de recursos de cálculo, con una proporción de hasta 1:10 en la partición de xPU, para que un mismo recurso pueda servir a varios propósitos.

Esta parte es importante porque muchas empresas no van a operar un único modelo ni una única carga. Tendrán asistentes internos, agentes de soporte, sistemas de análisis documental, modelos de visión, motores de búsqueda semántica, flujos de automatización y aplicaciones de negocio que competirán por recursos. Si esa demanda no se gestiona bien, la IA puede convertirse en una infraestructura cara y difícil de gobernar.

El segundo componente es ModelEngine Nexent, una plataforma para generar agentes mediante interacción en lenguaje natural. Huawei afirma que puede reducir un 80 % el tiempo de despliegue y que los agentes mejoran mediante optimización automática de habilidades, prompts y memoria. De nuevo, son cifras de fabricante, pero apuntan a un cambio de fondo: los agentes dejan de ser experimentos de laboratorio y empiezan a tratarse como piezas operativas del entorno empresarial.

Esta visión encaja con una tendencia más amplia. Los agentes empiezan a verse como “empleados digitales” capaces de consultar datos, llamar a herramientas, ejecutar procesos y mantener contexto. Pero eso también introduce riesgos. Si un agente puede acceder a documentos, sistemas de negocio o datos sensibles, la infraestructura debe registrar qué hizo, con qué permisos, sobre qué información y bajo qué controles.

La resiliencia de datos entra en la arquitectura de IA

El último bloque del anuncio se centra en resiliencia. Huawei advierte de riesgos como uso indebido de herramientas, envenenamiento de datos, manipulación y ransomware. Es una mención relevante porque la seguridad de la IA no se limita a proteger modelos. También implica proteger los datos de entrenamiento, las bases documentales, los vectores, las memorias de agentes, los flujos de caché y los sistemas que alimentan la inferencia.

Un agente que trabaja con datos manipulados puede tomar malas decisiones. Una base de conocimiento contaminada puede generar respuestas erróneas. Un ransomware contra el repositorio documental puede paralizar procesos críticos. Una memoria de agente con información sensible mal gobernada puede convertirse en una fuga. Por eso la infraestructura de datos para IA tiene que diseñarse con protección desde el origen, no añadirse al final.

El anuncio de Huawei también tiene una lectura competitiva. La compañía no está intentando vender solo cabinas de almacenamiento, sino una arquitectura completa para centros de IA empresariales. En un mercado donde NVIDIA domina buena parte del debate sobre computación, y donde los hiperescalares ofrecen plataformas integradas de IA, Huawei quiere posicionarse desde la capa de datos, memoria, almacenamiento y agentes.

La propuesta llega además en un contexto geopolítico en el que China busca reducir dependencia tecnológica y reforzar sus propias plataformas para IA empresarial. Huawei, con su experiencia en telecomunicaciones, cloud, almacenamiento y chips Ascend, está intentando construir una alternativa más integrada para clientes industriales, administraciones y grandes organizaciones.

El reto será demostrar rendimiento real, interoperabilidad, costes y madurez fuera de entornos controlados. Las cifras comunicadas son ambiciosas, pero las empresas necesitarán pruebas con sus propios datos, cargas y requisitos de cumplimiento. En IA empresarial, el marketing técnico no basta: hacen falta arquitecturas que funcionen de forma estable, segura y mantenible.

El mensaje de fondo, aun así, es acertado. La próxima fase de la inteligencia artificial no dependerá solo de modelos más grandes. Dependerá de infraestructuras capaces de alimentar esos modelos con datos fiables, memoria eficiente, búsqueda rápida, agentes gobernados y protección frente a fallos o ataques. Huawei ha puesto su apuesta sobre la mesa: el centro de datos de IA empieza en el dato.

Preguntas frecuentes

¿Qué ha presentado Huawei en el IDI Forum 2026?
Huawei ha presentado una solución de infraestructura de datos de pila completa para centros de datos de inteligencia artificial, con almacenamiento, data lake, memoria contextual, gestión de modelos, agentes y resiliencia.

¿Qué es Context Memory Storage?
Es una propuesta de Huawei para crear un pool compartido de caché KV a gran escala en clústeres de inferencia, con el objetivo de reducir la latencia y mejorar el uso de memoria en cargas de IA.

¿Por qué importa la caché KV en IA generativa?
Porque permite reutilizar información intermedia durante la generación de texto o la ejecución de agentes, reduciendo cálculos repetidos y mejorando la respuesta en sesiones largas.

¿Qué riesgos de seguridad quiere cubrir Huawei?
La compañía menciona riesgos como uso indebido de herramientas, envenenamiento de datos, manipulación y ransomware, todos ellos relevantes cuando agentes y modelos dependen de grandes repositorios de datos.