Huawei Cloud presenta Agentic Infra para llevar la IA agéntica a escala empresarial

Huawei Cloud ha presentado en Shanghái una nueva generación de productos para inteligencia artificial agéntica con una idea de fondo muy clara: las empresas no solo necesitan modelos más potentes, sino una infraestructura capaz de ejecutar agentes de forma segura, continua y eficiente. El anuncio se produjo durante Huawei Cloud INSPIRE 2026, celebrado en el West Bund International Convention & Exhibition Center, donde la compañía introdujo el concepto de Agentic Infra y una serie de servicios orientados a entrenamiento, inferencia, memoria, seguridad, gobierno y despliegue industrial de agentes.

La propuesta llega en un momento en el que el mercado está dejando atrás la fase de pruebas aisladas con modelos generativos. La siguiente batalla está en producción: agentes que razonan, consultan datos, ejecutan tareas, mantienen contexto durante más tiempo y operan en sectores como salud, fabricación, energía, robótica, investigación científica o administración. Para Huawei Cloud, ese salto exige una arquitectura distinta a la nube tradicional, con una coordinación más estrecha entre hardware, software, almacenamiento, redes, seguridad y plataformas de desarrollo.

Agentic Infra: una fábrica de tokens para cargas generales e IA

El núcleo del anuncio es Agentic Infra, una nueva infraestructura unificada para cargas generales y cargas de IA. Huawei Cloud la define a partir de cuatro ideas: una “fábrica de tokens” eficiente, aprendizaje continuo, planificación unificada de cómputo general e IA, y autonomía segura. La expresión puede sonar ambiciosa, pero apunta a un problema real: ejecutar agentes a escala no consiste solo en tener GPUs o NPUs disponibles, sino en coordinar cómputo, memoria, red, inferencia y aislamiento con muy baja latencia.

Uno de los productos principales es AI Cluster Service, AICS, construido sobre la red UnifiedBus. Según Huawei Cloud, este servicio soporta clústeres de más de 100.000 tarjetas, con una capacidad total de hasta 200 EFLOPS. La compañía también afirma que reduce la latencia de generación de tokens a menos de 10 milisegundos y alcanza un rendimiento de 5 millones de tokens por segundo en 1.000 tarjetas, con una disponibilidad online del 99,95 %.

AICS se presenta así como una pieza para operar grandes cargas de inferencia y entrenamiento, especialmente en escenarios donde el volumen de peticiones y la latencia son determinantes. En la práctica, Huawei intenta posicionar su infraestructura como una alternativa para empresas e industrias que necesitan desplegar IA a gran escala sin depender de una colección fragmentada de servicios.

Producto o servicioFunción principalDato destacado anunciado
AI Cluster Service (AICS)Clústeres de IA para entrenamiento e inferenciaMás de 100.000 tarjetas y hasta 200 EFLOPS
Agentic Memory Storage (AMS)Memoria persistente y escalable para agentesEspacio PB-scale y pooling KV-cache por niveles
CCE VolcanoNextPlanificación unificada de cargas generales e IAMás del 30 % de mejora en uso de recursos
AgentSphereRuntime seguro y elástico para agentesArranque en menos de 100 ms
ModelArtsNextPlataforma de entrenamiento e inferenciaRouting de modelos y RLaaS empresarial
AgentArtsPlataforma empresarial de agentesTareas largas, seguridad, know-how sectorial y observabilidad
openJiuwenEdición open source de AgentArtsComparte más del 90 % del kernel con AgentArts Enterprise
CloudRoboPlataforma cloud para robotsMigración a la nube en horas y despliegue de modelos en minutos

Otra pieza relevante es Agentic Memory Storage, AMS, orientada a romper el cuello de botella de memoria de los agentes. Huawei Cloud explica que combina NPU passthrough con Context Memory Storage para crear un espacio de memoria a escala de petabytes. También soporta pooling KV-cache por niveles, una técnica importante para reducir costes de inferencia y permitir tareas de larga duración.

Esta parte es clave porque los agentes no solo consumen cálculo. Necesitan mantener contexto, recuperar memoria, operar durante horas o días y gestionar estados intermedios. Sin una capa de memoria eficiente, el coste y la complejidad de los agentes se disparan.

CCE VolcanoNext, por su parte, actúa como motor de planificación unificada para cargas generales y de IA. Huawei Cloud afirma que, mediante pooling compartido de entrenamiento e inferencia y consolidación de fragmentación, puede mejorar el uso de recursos en más de un 30 %. En entornos empresariales, esa eficiencia puede marcar diferencias económicas importantes, porque muchos proyectos de IA fallan no por falta de modelos, sino por costes de infraestructura difíciles de sostener.

ModelArtsNext y AgentArts: del modelo al agente empresarial

Huawei Cloud también presentó ModelArtsNext, una nueva plataforma para entrenamiento e inferencia de modelos. Sus cuatro capacidades principales son Reinforcement Learning as a Service, inferencia confidencial, routing de modelos y matriz de modelos. El routing de MaaS permite aplicar tres políticas: prioridad a la experiencia, prioridad a la eficiencia o modo equilibrado. La plataforma decide dinámicamente qué modelo atiende cada petición según sus características.

Según Huawei Cloud, ya ofrece más de 15 servicios de modelos de última generación, con una precisión de scheduling superior al 95 % y una reducción media del 20 % en costes de llamada. El enfoque responde a una tendencia clara: las empresas no quieren depender de un único modelo para todo. Necesitan enrutar cada tarea al modelo más adecuado por coste, rendimiento, precisión, latencia o cumplimiento.

El RLaaS empresarial es otra apuesta importante. Huawei Cloud quiere convertir el aprendizaje por refuerzo en una capacidad accesible para organizaciones que buscan ajustar modelos a procesos concretos. La compañía afirma que los usuarios podrán crear tareas en un minuto, contar con visualización extremo a extremo y mantener consistencia entre entrenamiento e inferencia.

AgentArts completa la capa de plataforma. Se trata de una solución empresarial para crear y desplegar agentes, con cuatro capacidades principales: tareas de larga duración en producción, seguridad empresarial, conocimiento sectorial profundo y observabilidad de extremo a extremo. Huawei Cloud habla de “harness engineering”, es decir, ingeniería para organizar y controlar cómo los agentes usan herramientas, datos, memoria, modelos y procesos.

La compañía también ha lanzado openJiuwen, una edición open source de AgentArts que comparte más del 90 % de su núcleo con la versión empresarial. Este movimiento puede ayudar a atraer desarrolladores y socios, aunque el valor empresarial seguirá estando en la integración con la infraestructura, el soporte, el gobierno y los servicios cloud de Huawei.

Además, AgentArts Orchard funciona como un portal que reúne servicios cloud agénticos, agentes, modelos y aplicaciones. La idea es automatizar el proceso completo, desde la comprensión de la intención y el desarrollo de funciones hasta el aprovisionamiento de recursos y el despliegue de aplicaciones. En otras palabras, Huawei quiere que los propios agentes participen en la creación y operación de nuevos servicios.

Seguridad, nube híbrida e industria como ejes

La seguridad tuvo un papel central en el anuncio. Huawei Cloud presentó una solución que cubre el ciclo de vida completo de la IA, con protección para agentes, modelos e infraestructura agéntica. Entre las novedades figura una zona de seguridad de datos con cifrado hardware dedicado, tecnología Hold Your Own Key, cápsulas de datos y aislamiento multidimensional para infraestructura agéntica. El mensaje es claro: la compañía quiere responder a las preocupaciones de soberanía, confidencialidad y control de datos en sectores regulados.

También anunció una solución de computación confidencial para IA con máquinas virtuales confidenciales, atestación remota en la nube, gestión de claves, gateway de inferencia confidencial y NPU passthrough basado en PCIPC. Esta solución está pensada para inferencia confidencial, preentrenamiento confidencial y aprendizaje federado confidencial, tres escenarios donde los datos o modelos tienen alto valor y no pueden exponerse sin garantías.

Huawei Cloud también presentó el libro blanco Building Agent-Oriented Hybrid Cloud for Enterprises, centrado en la evolución de la nube híbrida en la era de los agentes. La compañía defiende que su nube híbrida sirve ya a más de 5.500 clientes en todo el mundo y que mantiene una posición destacada en nube híbrida financiera y nube dedicada. El documento aborda la construcción de lagos de datos de IA, la coordinación entre modelos online estables e iteraciones offline más ágiles, y la creación de entornos seguros para desarrollo y ejecución de agentes.

En el plano sectorial, Huawei Cloud anunció cuatro zonas dentro de su Industry AI Foundry: Smart Healthcare Zone, Embodied AI Zone, Smart Manufacturing Zone y Scientific Computing Zone. La primera se refuerza con una plataforma de IA para salud que entrará en beta abierta el 30 de junio y con una solución de patología inteligente ya replicada en hospitales de distintos niveles en China. Más de 20 hospitales se incorporan a esta zona, según la compañía.

La Embodied AI Zone está orientada a IA física y robótica. Huawei Cloud presentó CloudRobo, una plataforma de desarrollo inteligente para robots que combina datos a escala de petabytes, pipelines de desarrollo, motor cloud-native de producción de modelos robóticos y un sistema Real-Sim para generación de datos y evaluación. La compañía afirma que permite migrar robots a la nube en horas y desplegar modelos en minutos, con beta abierta prevista para el 30 de junio.

La Smart Manufacturing Zone busca facilitar agentes industriales, mientras que la Scientific Computing Zone apunta a clientes de AI4S, IA para ciencia, con modelos y agentes para acelerar investigación.

Huawei Cloud también anunció un AI Model Partner Program junto a más de 20 proveedores de modelos, entre ellos Zhipu AI, DeepSeek, MiniMax, Kimi, StepFun, Baidu, iFLYTEK Spark, Meituan, AIsphere y Shengshu Technology. El objetivo es crear un ecosistema de modelos diverso y conectado a sus servicios cloud.

El anuncio de Huawei Cloud muestra una estrategia amplia: no vender solo modelos ni solo infraestructura, sino una pila completa para la era agéntica. Clústeres, memoria, routing de modelos, runtime seguro, plataformas de agentes, nube híbrida, seguridad, industria y ecosistema de modelos forman parte del mismo relato. El reto será demostrar que esa integración puede competir fuera de China en un mercado cada vez más marcado por regulación, soberanía digital, sanciones, compatibilidad y confianza.

Preguntas frecuentes

¿Qué es Agentic Infra de Huawei Cloud?

Agentic Infra es la nueva propuesta de infraestructura de Huawei Cloud para ejecutar cargas generales e inteligencia artificial agéntica. Integra cómputo, memoria, planificación, seguridad y runtime para agentes empresariales.

¿Qué aporta Agentic Memory Storage?

Agentic Memory Storage, AMS, crea un espacio de memoria a escala de petabytes y soporta pooling KV-cache por niveles para reducir costes de inferencia y permitir tareas de agentes de larga duración.

¿Qué es AgentArts?

AgentArts es la plataforma empresarial de Huawei Cloud para crear, desplegar y operar agentes de IA en producción, con capacidades de tareas largas, seguridad, conocimiento sectorial y observabilidad.

¿Qué sectores prioriza Huawei Cloud?

Huawei Cloud ha anunciado zonas específicas para salud inteligente, IA física y robótica, fabricación inteligente y computación científica, además de un programa con proveedores de modelos como DeepSeek, MiniMax, Kimi o Zhipu AI.

vía: huawei

encuentra artículos

newsletter

Recibe toda la actualidad del sector tech y cloud en tu email de la mano de RevistaCloud.com.

Suscripción boletín

LO ÚLTIMO

Las últimas novedades de tecnología y cloud

Suscríbete gratis al boletín de Revista Cloud. Cada semana la actualidad en tu buzón.

Suscripción boletín
×