Jensen Huang volvió a usar una imagen poderosa para describir el momento que vive la inteligencia artificial empresarial. En Dell Technologies World, el consejero delegado de NVIDIA aseguró que la demanda “se ha vuelto parabólica”, una forma de resumir lo que Dell y NVIDIA quieren vender al mercado: la IA ya no está solo en fase de pruebas, sino entrando en despliegues reales, con agentes autónomos, inferencia a gran escala y modelos ejecutándose dentro de la propia empresa.
El mensaje de fondo es claro. Las compañías han pasado de experimentar con chatbots y pilotos aislados a preguntarse cómo integrar agentes de IA en procesos internos, bases de datos, código, documentación, operaciones industriales y flujos de trabajo sensibles. Y ahí aparece el gran debate: qué parte de esa IA debe ejecutarse en el cloud público y qué parte conviene mover a infraestructuras propias, ya sea on-premise, en colocation, en el edge o en estaciones de trabajo avanzadas.
Dell AI Factory with NVIDIA: del piloto a producción
La keynote de Michael Dell y Jensen Huang giró alrededor de Dell AI Factory with NVIDIA, una propuesta que combina servidores, redes, almacenamiento, software, servicios y modelos para desplegar inteligencia artificial empresarial de extremo a extremo. NVIDIA habla de una plataforma para agentes autónomos que va desde estaciones de trabajo “deskside” hasta racks completos de centro de datos. Dell, por su parte, insiste en que la IA empresarial necesita seguridad, gobernanza y costes más previsibles que los de una estrategia basada únicamente en APIs cloud.
Las cifras presentadas ayudan a entender el tamaño de la apuesta. Según Dell, el gasto mundial en infraestructura de IA podría situarse entre 3 y 4 billones de dólares de aquí a 2030, mientras que el consumo de tokens crecería un 3.400 % en el mismo periodo. Son previsiones de parte interesada, pero apuntan a una realidad ya visible: cuando la IA pasa de demo a producción, el coste de inferencia, la disponibilidad de datos y la eficiencia de la infraestructura pesan tanto como el modelo elegido.
| Dato anunciado por Dell y NVIDIA | Cifra |
|---|---|
| Empresas usando cargas de IA en Dell AI Factories with NVIDIA | 5.000 |
| Gasto mundial estimado en infraestructura de IA hasta 2030 | 3-4 billones de dólares |
| Crecimiento proyectado del consumo de tokens hasta 2030 | 3.400 % |
| Cargas de IA que ya se ejecutarían fuera del cloud, según encuesta de Dell | 67 % |
| Empresas encuestadas con al menos una carga de IA on-premise | 88 % |
| Ahorro estimado de Dell Deskside Agentic AI frente a APIs cloud en dos años | hasta el 87 % |
| Punto de equilibrio estimado frente a APIs cloud públicas | desde 3 meses |
Conviene leer estas cifras con cautela. El ahorro frente al cloud dependerá del volumen de uso, del tipo de modelo, de la energía, del personal técnico, de la amortización del hardware y de las necesidades de disponibilidad. Aun así, el argumento empieza a resultar familiar para muchas empresas: si los agentes de IA van a consultar datos internos de forma constante, ejecutar código, trabajar con documentación confidencial y generar tokens durante horas, el modelo puramente cloud puede volverse difícil de controlar.
Vera Rubin, PowerEdge y la guerra del coste por token
La parte más potente del anuncio está en la nueva generación de infraestructura acelerada. Dell ha presentado el PowerEdge XE9812 basado en NVIDIA Vera Rubin NVL72, una plataforma que, según NVIDIA, permitirá reducir hasta 10 veces el coste por token frente a Blackwell en inferencia agéntica a gran escala. También llegan los servidores PowerEdge XE9880L, XE9885L y XE9882L sobre NVIDIA HGX Rubin NVL8, con soporte para hasta 144 GPU por rack y nodos de computación con refrigeración líquida directa.
El foco ya no está solo en entrenar modelos cada vez más grandes. La nueva batalla está en servir inferencia de forma masiva, barata y estable. Los agentes de IA no responden una única pregunta y se detienen. Pueden consultar herramientas, dividir tareas, generar y revisar código, acceder a bases de datos, recuperar documentos, validar respuestas y repetir pasos. Eso multiplica el uso de tokens y aumenta la presión sobre CPU, GPU, memoria, red y almacenamiento.
NVIDIA Vera, la CPU diseñada para este tipo de cargas, aparece como otra pieza relevante. Dell la integrará en servidores PowerEdge M9822 y R9822. Según NVIDIA, Vera ofrece 1,2 TB/s de ancho de banda de memoria y completa cargas agénticas un 50 % más rápido que procesadores x86 tradicionales en los escenarios citados por la compañía. También se menciona una mejora de hasta 3 veces en consultas analíticas con Starburst sobre Vera CPU para SQL a gran escala.
| Producto o tecnología | Papel en la estrategia |
|---|---|
| Dell PowerEdge XE9812 con NVIDIA Vera Rubin NVL72 | Inferencia agéntica a gran escala y reducción del coste por token |
| PowerEdge XE9880L, XE9885L y XE9882L con HGX Rubin NVL8 | Servidores refrigerados por líquido para alta densidad de GPU |
| NVIDIA Vera CPU | Cargas secuenciales de agentes, analítica, pipelines de datos y sandboxes |
| Dell PowerSwitch con Quantum-X800 y Spectrum-6 | Red de alto rendimiento para clústeres de IA |
| Dell PowerRack | Sistema integrado de computación, red y almacenamiento para IA y HPC |
| Dell AI Data Platform with NVIDIA | Preparación, búsqueda, analítica y conexión de datos empresariales con modelos |
La infraestructura en rack también gana protagonismo. Dell PowerRack se presenta como un sistema integrado donde computación, red, almacenamiento, refrigeración, gestión energética y software se diseñan como una unidad. La lectura es sencilla: en IA a gran escala, ya no basta con comprar GPUs. El rendimiento real depende de la red, la refrigeración líquida, la alimentación eléctrica, el almacenamiento y la integración operativa.
Agentes en local, datos protegidos y modelos bajo control
Una de las ideas más repetidas durante el evento fue la necesidad de acercar la IA a los datos. Dell Deskside Agentic AI permite desplegar agentes en estaciones de trabajo locales con NVIDIA NemoClaw, NVIDIA OpenShell y modelos Nemotron, además de equipos Dell Pro Max con GB10 y GB300 y estaciones Dell Pro Precision con GPU RTX PRO Blackwell. La propuesta cubre modelos desde 30.000 millones hasta 1 billón de parámetros, según la configuración.
Este enfoque tiene sentido para departamentos de ingeniería, investigación, diseño, finanzas, sector público o industrias reguladas. Un agente que trabaja con código fuente, propiedad intelectual, datos sanitarios, documentación legal o información industrial no siempre puede depender de una API externa. La alternativa que plantean Dell y NVIDIA es ejecutar agentes localmente, probarlos cerca de los datos y escalar después al centro de datos corporativo si el caso de uso madura.
La seguridad se apoya en NVIDIA OpenShell, un runtime open source para desarrollar y desplegar agentes con controles de privacidad y políticas corporativas. También entra en juego NVIDIA Confidential Computing, que Dell vincula con socios como Fortanix, Google y Red Hat para proteger modelos y datos en uso. La promesa es permitir despliegues de modelos avanzados dentro del perímetro empresarial sin exponer pesos del modelo ni información sensible.
El catálogo de modelos y socios también se amplía. NVIDIA menciona Nemotron como opción de modelos abiertos para empresas que quieren ajustar pesos a sus propios dominios. Dell y NVIDIA hablan además de Reflection, MiniMax, DeepSeek, GLM, Kimi, Mistral, Gemma y otros modelos disponibles a través de Dell Enterprise Hub en Hugging Face. OpenAI Codex se conectará con Dell AI Data Platform para acercarse al contexto interno de las empresas, como bases de código, documentación y sistemas de negocio.
El mensaje para CIOs y responsables de infraestructura es directo: la IA agéntica no se desplegará solo como una aplicación SaaS más. En muchos casos exigirá una arquitectura propia, con datos gobernados, modelos autorizados, registros de actividad, aislamiento de ejecución, protección de secretos y una red capaz de sostener flujos intensivos entre agentes, herramientas y sistemas internos.
También hay una lectura económica. Si los agentes generan cada vez más tokens y realizan más trabajo en segundo plano, el coste variable de las APIs puede volverse difícil de predecir. Comprar infraestructura propia no siempre será más barato, pero sí puede dar más control cuando el uso es estable, intensivo y sensible. Para cargas esporádicas, el cloud seguirá siendo razonable. Para agentes que trabajan a diario sobre datos corporativos, el cálculo empieza a cambiar.
La alianza entre Dell y NVIDIA refleja hacia dónde se mueve el mercado: menos discurso abstracto sobre “usar IA” y más conversación sobre racks, refrigeración líquida, CPUs especializadas, datos internos, seguridad, coste por token y despliegues reales. La IA empresarial entra en una fase menos vistosa, pero mucho más importante: la de convertir pilotos en sistemas que funcionen todos los días.
Preguntas frecuentes
¿Qué anunció NVIDIA junto a Dell en Dell Technologies World?
NVIDIA y Dell presentaron nuevas piezas de Dell AI Factory with NVIDIA, incluyendo sistemas con Vera Rubin, servidores PowerEdge, Dell PowerRack, Dell Deskside Agentic AI, NVIDIA OpenShell y nuevas integraciones de modelos y socios empresariales.
¿Por qué Jensen Huang dice que la demanda de IA es “parabólica”?
Porque las empresas están pasando de pruebas aisladas a inferencia y agentes de IA en producción. Ese salto aumenta el consumo de tokens, la necesidad de computación y la presión sobre la infraestructura.
¿Qué es Dell Deskside Agentic AI?
Es una propuesta para ejecutar agentes de IA en estaciones de trabajo locales, con modelos abiertos, NVIDIA NemoClaw y OpenShell, pensada para equipos que necesitan trabajar con datos sensibles sin depender siempre del cloud.
¿La IA empresarial se va a mover fuera del cloud público?
No por completo. El escenario más probable es híbrido. Algunas cargas seguirán en cloud, pero los datos sensibles, los agentes persistentes y ciertos modelos ajustados a negocio pueden ejecutarse on-premise, en colocation, en edge o en estaciones locales.
vía: blogs.nvidia