25 marzo 2026
Empresas, Noticias
5 minutos de lectura

NVIDIA llega a GTC 2026 con la inferencia en el centro y dudas sobre la GPU única

Silvia A. Feliz

NVIDIA arranca hoy GTC 2026 en San José con una presión distinta a la de otros años. La conferencia se celebra del 16 al 19 de marzo y la keynote de Jensen Huang está fijada para este lunes, en un evento donde la propia compañía promete anuncios sobre Inteligencia Artificial, computación acelerada y robótica. Pero esta vez el foco no está solo en lanzar más potencia bruta, sino en demostrar que sabe adaptarse a una nueva fase del mercado: la de la inferencia, los agentes de IA y la infraestructura a escala de fábrica.

La gran pregunta que sobrevuela GTC 2026 es si NVIDIA empezará a matizar de verdad su vieja idea de que una GPU puede resolver prácticamente cualquier carga relevante de IA. No porque la GPU vaya a dejar de ser central, sino porque el mercado está cambiando. Reuters explica que los analistas esperan una oleada de anuncios orientados a reforzar a NVIDIA en inferencia y “agentic AI”, justo cuando rivales, clientes y nuevos chips específicos empiezan a presionar más en esa parte del negocio que en el entrenamiento puro.

Ese cambio de enfoque no es menor. En los últimos años, la narrativa del sector giró alrededor del entrenamiento de grandes modelos, un terreno donde Hopper y después Blackwell consolidaron a NVIDIA como referencia absoluta. Pero ahora la conversación se está desplazando hacia otra necesidad: ejecutar esos modelos de forma rápida, rentable y a gran escala para asistentes, agentes y aplicaciones empresariales. Reuters subraya que el propio mercado de IA empieza a virar desde enormes clústeres de entrenamiento hacia una nueva capa de servicios donde la inferencia y la orquestación de agentes ganan peso.

Por eso, una parte importante de las expectativas alrededor de GTC 2026 se concentra en Groq. Reuters publicó el 13 de marzo que NVIDIA es previsible que presente productos nacidos de su compra de Groq por 17.000 millones de dólares en diciembre, con el objetivo de reforzar su posición en inferencia rápida y barata. La agencia añade que los analistas esperan nuevas líneas de servidores que combinen chips de Groq con tecnologías de red de NVIDIA, en un movimiento que apuntaría justamente a complementar la GPU con hardware más especializado para determinadas fases de la inferencia.

Ahí está el núcleo de la historia. No hay confirmación oficial, al menos antes de la keynote, de que NVIDIA vaya a abandonar un modelo “GPU-only” en sentido estricto. Pero sí hay señales claras de que la empresa quiere ampliar su plataforma con piezas más específicas según la carga de trabajo. Y eso encaja con la propia tesis de Reuters: NVIDIA afronta una competencia creciente de chips a medida, ASICs y soluciones internas de clientes como OpenAI y Meta, especialmente en inferencia. En ese contexto, ampliar la plataforma tiene más sentido que defender una pureza arquitectónica que el mercado ya ha empezado a cuestionar.

Además, la transición no pasa solo por Groq. Reuters también apunta a que GTC 2026 puede traer más protagonismo para los CPU dentro de la infraestructura de IA, sobre todo en lo que llama la capa de “agent orchestration”. La idea es que, si el futuro inmediato pasa por flotas de agentes moviéndose entre aplicaciones, servicios y datos, el cuello de botella no siempre estará en el cálculo matricial de la GPU, sino también en cómo se coordinan esas tareas, se reparten flujos y se gestionan dependencias. Eso abre espacio para servidores centrados en CPU y para una arquitectura más heterogénea que la vista hasta ahora.

Donde sí hay más base oficial es en la hoja de ruta de infraestructura. NVIDIA ya viene preparando el terreno desde hace meses para Rubin, Rubin Ultra y la siguiente generación de racks. En octubre de 2025, la compañía explicó en su blog oficial que Vera Rubin NVL72 será una pieza clave para las “AI factories” y que la arquitectura Kyber está pensada para 576 GPU Rubin Ultra hacia 2027. Ese mismo texto también confirmó que Intel y Samsung Foundry se suman al ecosistema NVLink Fusion para integrar CPUs x86 y chips personalizados dentro de la infraestructura de NVIDIA. Es decir, incluso en la documentación corporativa más reciente, la empresa ya habla en términos de plataforma abierta y de integración de silicon diverso, no solo de GPU aisladas.

Otro punto que probablemente gane protagonismo es la óptica. Reuters señala que también se esperan más explicaciones sobre las inversiones de 2.000 millones de dólares que NVIDIA ha realizado en Lumentum y Coherent, dos empresas centradas en láseres para interconexión óptica. En paralelo, el blog oficial de NVIDIA ya vincula Kyber y la era Rubin Ultra a centros de datos de 800 VDC y a nuevas densidades de rack pensadas para escalar IA a nivel gigavatio. Todo apunta a que GTC 2026 no hablará solo de chips, sino de red, energía, refrigeración y conectividad como partes inseparables de la misma plataforma.

Sobre Feynman, la prudencia sigue siendo obligatoria. Reuters recoge que los analistas esperan una actualización de hoja de ruta “de Rubin a Feynman”, pero eso no equivale a una presentación detallada de producto ni valida muchas de las especulaciones que ya circulan sobre nodo, apilado o integración concreta con nuevas unidades de inferencia. Hoy, lo razonable es tratar Feynman como el siguiente gran hito de roadmap de NVIDIA, no como un lanzamiento inminente con especificaciones cerradas ya confirmadas.

En el fondo, GTC 2026 puede marcar algo más profundo que una nueva generación de hardware. Puede ser el momento en que NVIDIA admita, aunque sea sin decirlo de forma explícita, que la era de “una GPU para todo” empieza a quedarse corta para la nueva economía de la IA. No porque la GPU deje de mandar, sino porque ahora necesita convivir con CPU más visibles, interconexiones ópticas, racks enteros pensados como una sola unidad y chips especializados para inferencia. Si Jensen Huang confirma hoy esa dirección, GTC 2026 no será solo otra conferencia de producto. Será una declaración de cómo quiere NVIDIA seguir dominando cuando la IA deje de girar solo alrededor del entrenamiento y empiece a depender, sobre todo, de servir respuestas rápidas, baratas y masivas.

Preguntas frecuentes

¿Cuándo empieza GTC 2026 y cuándo es la keynote de Jensen Huang?

GTC 2026 se celebra del 16 al 19 de marzo de 2026 en San José. La keynote de Jensen Huang está programada para el 16 de marzo.

¿NVIDIA ha confirmado oficialmente un cambio total fuera de la GPU?

No. Antes de la keynote no hay confirmación oficial de un abandono de la estrategia basada en GPU. Lo que sí existe es una expectativa fuerte de anuncios en inferencia, agentes de IA, CPU y hardware complementario a raíz del contexto de mercado y de la compra de Groq.

¿Qué papel puede jugar Groq en GTC 2026?

Reuters sostiene que NVIDIA podría presentar productos ligados a su compra de Groq, con foco en inferencia rápida y eficiente, posiblemente integrados con la red y la plataforma de NVIDIA.

¿Qué se sabe oficialmente de Rubin Ultra y Kyber?

NVIDIA ya explicó en octubre de 2025 que Kyber está diseñada para alojar 576 GPU Rubin Ultra hacia 2027 y que forma parte de su visión de AI factories de gran densidad, con 800 VDC y nueva arquitectura de rack.