NVIDIA ha empezado a entregar los primeros sistemas basados en Vera, su nueva CPU diseñada para cargas de inteligencia artificial agéntica. La compañía asegura que los primeros equipos han llegado ya a Anthropic, OpenAI, SpaceXAI y Oracle Cloud Infrastructure, un movimiento que marca el paso de Vera desde el anuncio técnico a las primeras manos de clientes estratégicos. No es una CPU más dentro del catálogo de centros de datos: NVIDIA quiere convertirla en una pieza central de las llamadas AI factories, las infraestructuras donde se entrenan, ejecutan y coordinan modelos de IA a gran escala.
La noticia llega en un momento en el que la atención suele concentrarse en las GPU, pero la IA agéntica está cambiando el reparto de cargas dentro del centro de datos. Un agente no se limita a generar una respuesta y terminar. Puede buscar información, lanzar herramientas, ejecutar código, consultar bases de datos, abrir entornos aislados, analizar documentos, coordinar varios pasos y mantener contexto durante sesiones largas. Buena parte de ese trabajo no ocurre dentro de la GPU, sino alrededor de ella. Ahí es donde NVIDIA quiere situar a Vera.
Por qué una CPU vuelve a ser estratégica en la IA
Durante los últimos años, la narrativa de la inteligencia artificial se ha construido alrededor de las GPU. NVIDIA ha dominado ese mercado gracias a sus aceleradores, su software y su ecosistema de desarrolladores. Pero cuando los modelos empiezan a actuar como agentes, el cuello de botella no está solo en el cálculo matricial. También aparece en la orquestación, la gestión de memoria, las llamadas a herramientas, la ejecución de código, los entornos sandbox, la recuperación de información y el movimiento de datos entre procesos.
Vera está pensada para ese tipo de cargas. Según NVIDIA, incorpora 88 núcleos Olympus diseñados por la propia compañía, 1,2 TB/s de ancho de banda de memoria y un rendimiento por núcleo hasta un 50 % superior bajo carga. La CPU es compatible con Armv9.2 y admite 176 hilos mediante NVIDIA Spatial Multithreading, una técnica que reparte recursos físicos del núcleo en lugar de limitarse a alternar hilos por tiempo.
La compañía también destaca el soporte de hasta 1,5 TB de memoria LPDDR5X, conectividad NVLink-C2C de segunda generación con 1,8 TB/s de ancho de banda coherente y capacidades de Confidential Computing. En la práctica, NVIDIA busca que Vera no sea solo el procesador anfitrión que acompaña a una GPU, sino una CPU capaz de sostener miles de entornos de software paralelos y mantener alimentadas las tuberías de datos de los sistemas acelerados.
| Característica de NVIDIA Vera | Dato anunciado |
|---|---|
| Núcleos | 88 Olympus |
| Hilos | 176 con Spatial Multithreading |
| Arquitectura | Armv9.2 |
| Ancho de banda de memoria | Hasta 1,2 TB/s |
| Capacidad de memoria | Hasta 1,5 TB |
| NVLink-C2C | Hasta 1,8 TB/s |
| Mejora anunciada por núcleo | Hasta un 50 % bajo carga |
| Compatibilidad | Sistemas standalone, Vera Rubin NVL72 y plataformas HGX Rubin |
La lectura empresarial es clara. Si los agentes van a generar más llamadas, más código y más consultas a datos internos, la CPU deja de ser un componente secundario. En muchas cargas agénticas, la GPU acelera el modelo, pero la CPU organiza el trabajo que permite que ese modelo actúe.
Entregas a laboratorios de IA y a la nube
El despliegue inicial tiene un fuerte componente simbólico. NVIDIA no ha anunciado una disponibilidad masiva generalizada, sino entregas a algunos de los actores que marcan el ritmo de la IA: Anthropic, OpenAI, SpaceXAI y Oracle Cloud Infrastructure. Ian Buck, vicepresidente de Hyperscale and High-Performance Computing de NVIDIA, entregó personalmente los primeros sistemas, según el blog oficial de la compañía.
En Anthropic, Vera se presenta como una pieza prometedora para cargas agénticas. En OpenAI, la entrega se vincula a la necesidad de alimentar nuevas cargas de trabajo. En SpaceXAI, NVIDIA afirma que se está evaluando Vera para aprendizaje por refuerzo y pipelines de simulación basados en agentes. En Oracle Cloud Infrastructure, el mensaje es todavía más ambicioso: OCI planea desplegar cientos de miles de CPUs NVIDIA Vera a partir de 2026, con la intención de ofrecer infraestructura agéntica de producción a gran escala.
Ese punto es relevante porque coloca a Vera no solo en laboratorios de investigación, sino también en el cloud. Si OCI cumple esos planes, la CPU de NVIDIA podría aparecer como una nueva opción para empresas que quieran validar agentes, ejecutar cargas de razonamiento o desplegar servicios de IA con una arquitectura más ajustada a tareas de larga duración y alto uso de herramientas.
NVIDIA sitúa Vera dentro de una estrategia de codiseño más amplia, junto a Rubin GPU, BlueField-4 DPU, Spectrum-X y la arquitectura MGX. Además de funcionar como CPU independiente, Vera será el procesador anfitrión en Vera Rubin NVL72, donde se conectará con GPUs Rubin mediante NVLink-C2C. En esos sistemas, CPU y GPU comparten una arquitectura de memoria unificada para mantener mejor utilizado el cómputo acelerado.
La IA agéntica exige otra infraestructura
La llegada de Vera confirma una tendencia que ya se veía en los últimos anuncios de NVIDIA y Dell: la IA empresarial está dejando de medirse solo en número de GPUs. El rendimiento real dependerá de la coordinación entre CPU, GPU, memoria, red, almacenamiento, seguridad y software de orquestación. Un agente que genera código, lo prueba, consulta documentación interna y vuelve a intentarlo varias veces necesita una infraestructura distinta a la de un chatbot simple.
Esto explica por qué NVIDIA insiste en tareas como tool-calling, sandboxing, recuperación de contexto largo, analítica, gestión de KV cache y aprendizaje por refuerzo. Son cargas menos vistosas que el entrenamiento de un gran modelo, pero pueden decidir la eficiencia de una AI factory. Si la GPU espera a que la CPU prepare datos, coordine herramientas o mueva memoria, el coste total por resultado se deteriora.
También hay una dimensión energética. NVIDIA afirma que Vera puede manejar orquestación, control y movimiento de datos para alimentar GPUs con el doble de eficiencia energética frente a infraestructuras tradicionales. Es una afirmación de fabricante que habrá que comprobar con benchmarks independientes y cargas reales, pero apunta a una preocupación central del sector: la IA está consumiendo cada vez más energía, y cada mejora en eficiencia se traduce en menos coste operativo y menos presión sobre los centros de datos.
Para los hiperescalares, una CPU de este tipo puede encajar en servicios de IA gestionados, plataformas de agentes, entrenamiento por refuerzo, análisis de datos y entornos donde conviven modelos, herramientas y bases de datos. Para las empresas, el interés estará en saber si Vera aparece integrada en servidores, racks y clouds comerciales con un precio y una disponibilidad razonables.
El movimiento también tiene una lectura competitiva. NVIDIA no quiere limitarse a vender aceleradores. Con Vera, amplía su presencia hacia la CPU del centro de datos, un terreno históricamente dominado por Intel y AMD, y lo hace no desde la informática generalista, sino desde una carga concreta: la IA agéntica. Esa especialización puede ser una ventaja si el mercado adopta agentes de forma masiva, pero también supone depender de que esa promesa se convierta en producción real y no se quede en pilotos.
Vera no elimina la importancia de las GPU. Al contrario, refuerza la idea de que los sistemas de IA avanzados serán cada vez más integrados. La CPU alimenta, coordina y sostiene; la GPU acelera el cálculo; la red conecta; el almacenamiento entrega datos; y las capas de seguridad protegen modelos, contexto y ejecución. El centro de datos se parece menos a una suma de componentes y más a una máquina diseñada para producir inteligencia de forma continua.
La entrega de los primeros sistemas a OpenAI, Anthropic, SpaceXAI y Oracle no garantiza por sí sola el éxito comercial de Vera. Pero sí muestra hacia dónde quiere llevar NVIDIA su negocio: de la GPU como producto estrella a la AI factory como plataforma completa. En la era de los agentes, el chip que organiza el trabajo puede ser casi tan importante como el que calcula la respuesta.
Preguntas frecuentes
¿Qué es NVIDIA Vera?
NVIDIA Vera es la primera CPU personalizada de NVIDIA diseñada específicamente para IA agéntica, aprendizaje por refuerzo, orquestación de herramientas, sandboxes, analítica y flujos de datos en AI factories.
¿Por qué Vera es importante si la IA usa sobre todo GPU?
Porque los agentes de IA no dependen solo del cálculo del modelo. También ejecutan código, consultan herramientas, gestionan contexto, mueven datos y coordinan flujos de trabajo, tareas donde la CPU tiene un papel esencial.
¿Qué empresas han recibido los primeros sistemas Vera?
Según NVIDIA, los primeros sistemas han llegado a Anthropic, OpenAI, SpaceXAI y Oracle Cloud Infrastructure.
¿Vera sustituye a las GPU de NVIDIA?
No. Vera complementa a las GPU. Puede funcionar como CPU independiente o como procesador anfitrión en plataformas como Vera Rubin NVL72, donde trabaja junto a GPUs Rubin y otros componentes de red y seguridad.
vía: blogs.nvidia