NVIDIA ya no quiere ser solo la compañía que domina las GPU para inteligencia artificial. Con Vera, su primera CPU personalizada para centros de datos, la empresa entra de lleno en un territorio históricamente controlado por Intel y AMD. La jugada no es menor: según las declaraciones recogidas tras sus últimos resultados, NVIDIA ve en Vera una oportunidad de mercado de 200.000 millones de dólares y espera cerca de 20.000 millones de dólares en ingresos por CPU este año.
La cifra resulta llamativa incluso para una compañía acostumbrada a números enormes. NVIDIA cerró su primer trimestre fiscal de 2027 con unos ingresos récord de 81.600 millones de dólares, un 85 % más que un año antes, y su negocio de centros de datos alcanzó 75.200 millones. Su previsión para el segundo trimestre apunta a 91.000 millones de dólares, lo que confirma que el ciclo de inversión en infraestructura de IA sigue acelerado.
Por qué la IA agéntica necesita otra CPU
La tesis de NVIDIA es clara: los agentes de IA no viven solo dentro de la GPU. Un sistema agéntico tiene que ejecutar código, llamar a herramientas, gestionar memoria, consultar bases de datos, mover contexto, abrir entornos aislados, coordinar varios pasos y alimentar a las GPU con datos de forma constante. Muchas de esas tareas recaen en la CPU.
Hasta ahora, buena parte de la conversación sobre IA se ha centrado en el entrenamiento de modelos y en la inferencia acelerada por GPU. Pero la siguiente fase, marcada por agentes que actúan, razonan durante más tiempo y se integran con sistemas empresariales, exige una arquitectura distinta. Ahí entra Vera.
NVIDIA define Vera como una CPU diseñada para la era de la IA agéntica. Integra 88 núcleos Olympus propios, compatibilidad Armv9.2, 176 hilos mediante Spatial Multithreading, hasta 1,2 TB/s de ancho de banda de memoria LPDDR5X y soporte para hasta 1,5 TB de memoria. También incorpora NVLink-C2C de segunda generación con 1,8 TB/s de ancho de banda coherente para trabajar junto a las futuras GPU Rubin.
| Característica de NVIDIA Vera | Dato anunciado |
|---|---|
| Arquitectura | Armv9.2 |
| Núcleos | 88 Olympus |
| Hilos | 176 con Spatial Multithreading |
| Ancho de banda de memoria | Hasta 1,2 TB/s |
| Memoria soportada | Hasta 1,5 TB |
| Interconexión | NVLink-C2C de 1,8 TB/s |
| Uso principal | IA agéntica, RL, analítica, sandboxes y orquestación |
| Mejora anunciada | Hasta un 50 % más rápida por núcleo bajo carga |
El planteamiento cambia la forma de mirar a la CPU. En servidores tradicionales, el valor se medía a menudo en núcleos, consolidación y capacidad de alquilar recursos. Jensen Huang lo resumió de forma más directa: los agentes no “alquilan núcleos”; quieren que el trabajo se haga rápido. Para esa lógica, NVIDIA propone una CPU con alto rendimiento por núcleo, mucha memoria y una integración estrecha con su ecosistema de GPU, red y software.
De la GPU al sistema completo
Vera no llega sola. Forma parte de la arquitectura Vera Rubin, la siguiente gran plataforma de NVIDIA para inteligencia artificial a escala de rack. En Vera Rubin NVL72, la CPU actúa como procesador anfitrión de las GPU Rubin y se integra con BlueField-4, Spectrum-X, MGX y las redes de interconexión de NVIDIA. La compañía quiere que el centro de datos se compre y opere cada vez más como una unidad completa, no como una suma de componentes sueltos.
Ese es el movimiento estratégico de fondo. NVIDIA no solo vende chips: vende la fábrica de IA. GPU, CPU, red, DPU, software, librerías, sistemas de rack, gestión de cargas y herramientas para agentes. Cuanto más integrada sea la infraestructura de IA, más difícil será para un cliente sustituir una pieza sin tocar el resto.
La compañía ya ha empezado a entregar los primeros sistemas Vera a grandes laboratorios y proveedores cloud. NVIDIA comunicó que los primeros equipos llegaron a Anthropic, OpenAI, SpaceXAI y Oracle Cloud Infrastructure. OCI, además, ha declarado que planea desplegar cientos de miles de CPUs Vera a partir de 2026 para cargas de IA agéntica a gran escala.
| Uso de Vera | Papel en la estrategia |
|---|---|
| CPU independiente | Competir en servidores de alto rendimiento para IA y analítica |
| Host CPU en Vera Rubin | Alimentar y coordinar GPU Rubin en racks de IA |
| Vera con ConnectX-9 | Acelerar almacenamiento, seguridad y aislamiento |
| Vera para cloud | Ejecutar cargas agénticas, sandboxes y entornos paralelos |
| Vera para empresas | Llevar IA privada e inferencia agéntica a infraestructura propia |
La lectura para Intel y AMD es evidente. NVIDIA entra en la CPU no desde el servidor generalista, sino desde el punto donde más crece el gasto: la IA. No intenta competir primero por todos los centros de datos tradicionales, sino por las cargas donde el valor económico es mayor y donde su ecosistema ya tiene una posición dominante.
Un mercado enorme, pero con cuellos de botella
El entusiasmo de NVIDIA viene acompañado de un riesgo que la propia compañía reconoce: la oferta. Huang ha admitido que espera restricciones de suministro durante toda la vida de Vera Rubin. Tiene sentido. Vera depende de memoria LPDDR5X de alto rendimiento, de empaquetado avanzado, de capacidad de fabricación y de una cadena de suministro que ya está tensionada por la demanda de IA.
La memoria será una de las piezas más delicadas. Vera necesita gran capacidad y ancho de banda para sostener miles de entornos software paralelos, gestionar contexto y mantener alimentadas las GPU. Al mismo tiempo, la industria vive una fuerte presión sobre DRAM, HBM y memorias avanzadas por el crecimiento de los centros de datos de IA.
También está la competencia. Google, Amazon, Microsoft y otros hiperescalares desarrollan sus propios aceleradores o chips específicos para reducir costes y dependencia. AMD empuja EPYC y sus GPU Instinct. Intel intenta recuperar terreno en centros de datos. Y otros actores, como Groq, buscan nichos concretos de inferencia con arquitecturas diferentes.
NVIDIA sostiene que soluciones basadas en mucha SRAM y centradas en decode, como las orientadas a baja latencia y alta tasa de tokens, seguirán siendo productos de nicho durante un tiempo. Su argumento es que muchas cargas agénticas necesitan absorber grandes contextos, gestionar modelos más amplios y trabajar con pipelines más variados, no solo generar tokens a gran velocidad.
La CPU vuelve al centro de la conversación
Durante años, la CPU parecía perder protagonismo en la narrativa de la IA. La GPU era la estrella. Vera muestra que la historia se complica. Cuando la IA pasa de responder preguntas a ejecutar trabajos, la CPU vuelve a ser importante. No como sustituta de la GPU, sino como coordinadora del sistema.
La pregunta para los clientes será práctica: cuánto mejora Vera el coste por tarea completada. No basta con prometer más rendimiento por núcleo o más eficiencia energética. Los hiperescalares y empresas medirán si sus agentes terminan antes, si las GPU esperan menos, si los sandboxes se ejecutan mejor, si las consultas de datos son más rápidas y si el coste total de infraestructura baja de verdad.
Si NVIDIA cumple sus previsiones, Vera podría convertirse en uno de los lanzamientos más relevantes del mercado de servidores en años. No porque desplace de golpe a Intel y AMD en todas las cargas, sino porque redefiniría el segmento más estratégico: los centros de datos de IA.
El movimiento también refuerza una idea que se repite cada vez más: la inteligencia artificial no se construye solo con modelos. Se construye con CPU, GPU, memoria, red, refrigeración, energía, software y una arquitectura capaz de sostener millones de tareas simultáneas. NVIDIA ya dominaba buena parte de esa cadena. Con Vera, intenta ocupar otra pieza que hasta ahora estaba fuera de su control directo.
Preguntas frecuentes
¿Qué es NVIDIA Vera?
NVIDIA Vera es la primera CPU personalizada de NVIDIA para centros de datos, diseñada para cargas de IA agéntica, aprendizaje por refuerzo, analítica, orquestación, tool-calling y gestión de contexto.
¿Por qué NVIDIA entra ahora en el mercado de CPUs?
Porque los agentes de IA necesitan mucha capacidad de CPU para coordinar herramientas, ejecutar código, mover datos, gestionar memoria y alimentar a las GPU. NVIDIA quiere controlar esa parte de la infraestructura.
¿Cuánto espera ingresar NVIDIA con Vera?
Según declaraciones recogidas tras sus resultados, NVIDIA ve un mercado potencial de 200.000 millones de dólares para Vera y espera cerca de 20.000 millones de dólares en ingresos por CPU este año.
¿Vera sustituye a las GPU?
No. Vera está pensada para trabajar junto a las GPU. Su papel es coordinar, alimentar y ejecutar cargas de control, datos y agentes dentro de las futuras fábricas de IA.