La carrera por llevar agentes de inteligencia artificial a escala industrial suma un nuevo frente: Fujitsu y NVIDIA amplían su colaboración estratégica para cocrear infraestructura de IA de pila completa, combinando las CPUs Monaka de Fujitsu con las GPUs del líder de aceleración, enlazadas mediante NVLink Fusion. La propuesta apunta a sistemas semi-a medida para sectores como sanidad, manufactura y robótica, con primer foco en Japón y despliegues globales en una segunda fase.
La iniciativa tiene un doble eje: hardware co-diseñado a escala de rack y plataforma de agentes de IA construida sobre Kozuchi, el entorno cloud de Fujitsu lanzado en octubre de 2024. El acuerdo también integra el orquestador de cargas de IA de Fujitsu con NVIDIA Dynamo, marco modular de inferencia, para simplificar adopción, optimizar latencias y contener costes en entornos empresariales.
“La revolución industrial de la IA ha comenzado y debemos construir la infraestructura que la alimente —en Japón y en todo el mundo. Fujitsu es un pionero y el líder de confianza del país en supercomputación, investigación cuántica y sistemas empresariales”, señaló Jensen Huang, fundador y consejero delegado de NVIDIA, al explicar que ambos fabricantes “conectan y extienden” sus ecosistemas para la era de la IA.
“Nuestra colaboración estratégica con NVIDIA acelerará la transformación impulsada por IA en empresas y administraciones”, añadió Takahito Tokita, CEO de Fujitsu, al subrayar que el primer vertical será manufactura, “donde Japón es líder global”, con planes para expandir el acuerdo hacia HPC y computación cuántica.
¿Qué hay de nuevo? NVLink Fusion abre la puerta a arquitectura “semi-custom”
Durante años, el stack de NVIDIA ha sido percibido como cerrado; la presentación de NVLink Fusion rompe parcialmente esa inercia al permitir que aceleradores no NVIDIA —en este caso, las CPUs Monaka de Fujitsu— se integren de fábrica con GPUs de la marca en soluciones a escala de rack. El bus NVLink es la espina dorsal de ancho de banda que mitiga cuellos de botella entre chips, clave para agentes de IA que razonan, planifican y actúan en tiempo casi real.
En la práctica, el mensaje para clientes con cargas mixtas (cálculo denso, memoria compartida, E/S exigente) es claro: menos pegamento artesanal, más rendimiento sostenido y latencias predecibles. Y, sobre todo, más libertad para orquestar CPU+GPU con perfiles distintos según el sector y la aplicación.
Kozuchi: la “capa de arriba” ya estaba lista
Fujitsu no parte de cero en software. Kozuchi, su plataforma de IA en la nube, reúne servicios de IA y un agente que combina múltiples modelos para extraer conocimiento de datos de negocio. Nació resolviendo casos de negociación y rentabilidad, y ha ido expandiéndose a gestión de producción, asuntos legales y otras tareas horizontales de empresa.
Con la alianza, Kozuchi se convierte en el front-end de una infraestructura que combina Monaka+GPU por debajo, NVIDIA Dynamo (inferencias modulares) en el plano de ejecución, y el orquestador de Fujitsu para asignar cargas a CPU o GPU según necesidades de coste, rendimiento o protección de datos. Para clientes, esto se traduce en un único “control plane” que esconde la complejidad y expone APIs y plantillas de agentes centradas en procesos.
¿Por qué “agentes” y no sólo “modelos”? Tres motivos empresariales
- Autonomía supervisada. Un agente no sólo responde: puede decidir pasos, llamar herramientas, leer sistemas (ERP, MES, CRM), redactar y ejecutar acciones con controles y reglas. En fabricación, por ejemplo, un agente puede equilibrar producción, reprogramar órdenes y notificar a proveedores, sin atascar al equipo humano en tareas repetitivas.
- Composición. Los agentes permiten encadenar modelos (vision, lenguaje, series temporales) con costo total optimizado: reservar GPUs para lo que debe correr en GPU, y derivar lógica y pre/post-proceso a CPU cuando baste.
- Contexto y cumplimiento. Con capa de orquestación, se puede limitar qué datos ven los agentes, loggear decisiones y auditar resultados, algo crucial en sanidad, finanzas o administración.
Japón como pista de despegue: un encaje natural
El primer despliegue se centrará en Japón, un mercado con tradición de supercomputación, densidad industrial y apuesta país por IA responsable. Allí, Fujitsu es proveedor histórico de HPC y socio de centros de investigación, lo que facilita pilotos que requieren datos sensibles y tiempos de validación largos. A partir de esas referencias, el plan es escalar fuera: los casos de uso (líneas de montaje, mantenimiento predictivo, copilotaje en planta, triaje clínico, robots de almacén) son exportables con las adaptaciones locales de rigor.
¿Qué aporta cada parte?
- Fujitsu: CPU Monaka, Kozuchi (plataforma y agente), orquestación de cargas, implantación sectorial (manufactura, sanidad, robótica), relación con ecosistema japonés e histórico en HPC/cuántica.
- NVIDIA: GPUs, NVLink Fusion (interconexión de alto ancho de banda para diseños semi-custom), Dynamo (inferencias modulares), ecosistema de bibliotecas y frameworks que ya domina la industria.
El resultado es una pila “full-stack” en la que el cliente obtiene agentes listos para integrar con SaaS y datos on-prem, respaldados por una arquitectura de referencia validada por ambos fabricantes.
¿Qué cambia frente a “comprar GPUs y listo”?
Quien haya sufrido el paso de un PoC a producción sabe que el 80 % del trabajo ocurre después del demo: latencias que no cuadran, coste por token que se dispara, colas saturadas, datos que no se mueven a la velocidad debida, cumplimiento y auditoría que añaden fricción. El enfoque Fujitsu-NVIDIA ataca justo ahí:
- Acoplamiento CPU+GPU a nivel de rack con NVLink Fusion → menos saltos, más throughput.
- Orquestación que elige ruta (CPU vs GPU) en función de latencia/€ → predecible y tunable.
- Dynamo para cortar y recombinar pipelines de inferencia sin rehacer el stack.
- Kozuchi como capa de agente con conectoría empresarial y plantillas sectoriales.
La promesa: tiempo-a-valor más corto y TCO más controlable que un bricolaje de piezas separadas.
De la fábrica al hospital: verticales con tracción inmediata
- Manufactura: agentes que planifican producción ante cambios de demanda, recalibran líneas y enriquecen datos con visión para detectar defectos. Japón es terreno fértil por capacidad industrial y cultura de mejora continua.
- Sanidad: asistentes que resumen historias, proponen vías clínicas y gestionan citas/derivaciones respetando privacidad y normativa.
- Robótica: copilotos que integran sensórica, navegación y razonamiento para tareas en almacenes, planta o hospitales.
El reto no es sólo técnico: exige gobernanza de IA, métricas de seguridad (alucinaciones, drift), ciclos de retraining y formación para equipos.
Qué significará para el mercado
- NVIDIA abre un flanco “semi-custom”. NVLink Fusion permite a socios como Fujitsu llevar su CPU al mismo plano que la GPU, reduciendo la sensación de “one-size-fits-all” y dando a los integradores más control.
- Fujitsu ofrece “agencia” de IA con hardware co-diseñado. Su propuesta deja de ser sólo servicios y pasa a incluir arquitectura optimizada con una de las piezas clave del mercado.
- Clientes obtienen una ruta menos dolorosa a producción. Menos piezas sueltas, SLA más claros, y apoyo de dos actores con orientación a misión crítica.
Preguntas que quedan en el aire
- Coste: ¿cómo se comparará el TCO de una pila Monaka+GPU+NVLink Fusion frente a alternativas CPU x86 + GPU o GPU-only?
- Portabilidad: ¿hasta qué punto Dynamo + Kozuchi permitirán migrar entre nubes y on-prem sin rehacer todo?
- Soberanía de datos: ¿qué modos de despliegue se ofrecen para sectores con fuerte restricción regulatoria?
- Ecosistema: ¿qué ISVs y partners certificados acompañarán los primeros pilotos?
Señales de rumbo: HPC y cuántica en el horizonte
Ambas compañías anticipan que la colaboración se expandirá hacia alta computación y cuántica, áreas donde Fujitsu tiene histórico —y NVIDIA ya construye puentes con su software para simulación y aceleración cuántica. La lógica es coherente: agentes de IA cada vez más capaces necesitarán backends de física, optimización y simulación que exceden lo meramente lingüístico.
En resumen
- Qué: Fujitsu y NVIDIA co-desarrollarán infraestructura de IA de pila completa para agentes, uniendo CPUs Monaka y GPUs con NVLink Fusion, más Kozuchi y Dynamo en software.
- Para qué: sanidad, manufactura, robótica y otros verticales donde los agentes pueden planificar y ejecutar tareas con supervisión.
- Dónde: Japón primero; expansión global después.
- Por qué importa: es una vía industrializable para pasar de PoC a producción, con rendimiento predecible y gobernanza de IA integrada.
La alianza cristaliza una tendencia de fondo: los agentes dejarán de ser demos de laboratorio para convertirse en operadores digitales anclados a procesos reales. Y para eso hace falta menos “magia” y más ingeniería de sistemas: justo lo que esta colaboración promete.
Preguntas frecuentes
¿Qué es NVLink Fusion y por qué es relevante para agentes de IA?
Es la extensión del ecosistema NVLink que permite construir soluciones semi-a medida a escala de rack, emparejando aceleradores no NVIDIA (p. ej., Monaka) con GPUs. Para agentes, significa más ancho de banda CPU↔GPU, menos latencia y pipeline más fluido.
¿Qué papel juega Kozuchi en la propuesta Fujitsu-NVIDIA?
Kozuchi es la plataforma de IA de Fujitsu: expone servicios de agentes, gestiona datos y conecta con sistemas empresariales. En la alianza, orquesta junto con Dynamo y el orquestador de Fujitsu qué se ejecuta en CPU o GPU según coste/latencia.
¿Qué sectores verán primero agentes “en producción”?
La colaboración arranca con manufactura en Japón y se ampliará a sanidad y robótica, donde los agentes pueden automatizar decisiones (replanificar, triaje, mantenimiento) con controles y auditoría.
¿Cómo se simplifica la adopción para una empresa que empieza?
Con plantillas de agente y arquitecturas de referencia (CPU+GPU) ya validadas por ambos fabricantes, Dynamo para modular la inferencia, y el orquestador de Fujitsu para desplegar en cloud o on-prem con métricas claras de SLA y coste.
vía: sdxcentral