Nuevas herramientas y datasets abren la puerta a una revolución industrial basada en robots autónomos, agentes visuales y simulaciones en tiempo real.
El ecosistema industrial global está dando un paso decisivo hacia la integración de la inteligencia artificial física gracias a las nuevas iniciativas de NVIDIA. En el marco de la feria Hannover Messe, la compañía ha presentado el Mega Blueprint de NVIDIA Omniverse, una hoja de ruta para probar flotas de robots en entornos virtuales altamente realistas. Esta propuesta se suma al lanzamiento de un gigantesco conjunto de datos de código abierto que promete acelerar el entrenamiento de modelos de IA para robots, vehículos autónomos y ciudades inteligentes.
Gemelos digitales: el nuevo terreno de entrenamiento para la IA
La inteligencia artificial física —aquella que actúa en el mundo real mediante robots humanoides, sistemas autónomos o sensores inteligentes— requiere una fase de validación intensiva. Para ello, NVIDIA propone utilizar gemelos digitales: réplicas virtuales exactas de fábricas, almacenes y otras instalaciones industriales, capaces de simular con precisión interacciones complejas entre humanos y máquinas.
A través de su plataforma Omniverse y el uso del estándar OpenUSD, las empresas pueden desarrollar estos entornos virtuales y acelerar sus ciclos de innovación sin exponerse a riesgos en el mundo real. Compañías como Accenture, Schaeffler, Siemens, Delta Electronics o Rockwell Automation ya están aplicando este enfoque para optimizar layouts industriales, flujos logísticos o la colaboración entre operarios y robots como Digit, desarrollado por Agility Robotics.
Mega Blueprint: una guía para el despliegue masivo de robots
El Mega Blueprint proporciona un flujo de trabajo de referencia que permite simular interacciones entre múltiples tipos de robots —como AMRs (robots móviles autónomos) y humanoides— combinando generación de datos sintéticos y simulación de sensores. Este enfoque permite refinar políticas de navegación, manipulación y razonamiento espacial antes del despliegue físico.
Gracias a este ciclo cerrado de entrenamiento, los «cerebros» de los robots aprenden en entornos virtuales y, una vez validados, pueden transferirse al mundo real, donde continúan aprendiendo y retroalimentando el sistema con nuevos datos.
IA visual para instalaciones más inteligentes
Además de los robots móviles, NVIDIA apuesta por agentes de inteligencia artificial visual capaces de extraer conocimiento contextual en tiempo real de vídeos en directo o grabados. Estos agentes pueden integrarse en sistemas de inspección visual, vigilancia industrial o análisis de cumplimiento normativo, aumentando la seguridad, la eficiencia y el aprovechamiento del espacio.
El año pasado, la empresa ya presentó su blueprint de búsqueda y resumen de vídeo (VSS), utilizado ahora por socios industriales para mejorar sus flujos de trabajo mediante automatización visual avanzada.
Un dataset abierto para escalar la IA física
Para facilitar el desarrollo de esta nueva generación de IA física, NVIDIA ha publicado un megaconjunto de datos en Hugging Face. Este repositorio inicial contiene 15 terabytes de información, más de 320.000 trayectorias de entrenamiento robótico y hasta 1.000 activos digitales OpenUSD de tipo SimReady. Pronto se sumará un bloque adicional enfocado en vehículos autónomos, con clips de vídeo en condiciones reales en más de 1.000 ciudades de EE. UU. y Europa.
Este conjunto de datos, prevalidado y de calidad comercial, permite a investigadores y desarrolladores evitar los elevados costes de recolección de datos reales, y avanzar más rápido en la formación y prueba de modelos de IA para aplicaciones físicas.
Colaboración con universidades y centros de investigación
El uso del NVIDIA Physical AI Dataset ya ha sido adoptado por instituciones como UC Berkeley, Carnegie Mellon y la Universidad de California en San Diego (UCSD). Estas entidades planean aplicar los datos para entrenar modelos de conducción autónoma, robótica médica y asistentes humanoides para el hogar. La diversidad geográfica, ambiental y contextual del dataset ofrece un valor inédito para abordar casos límite y problemas de generalización.
«Este dataset nos permite entrenar modelos de IA que comprendan el contexto del mundo físico, algo esencial para la seguridad en vehículos autónomos o en entornos hospitalarios», explica Henrik Christensen, director del Instituto de Robótica Contextual de la UCSD.
Más allá del dataset: herramientas para desarrolladores
El conjunto de datos se complementa con herramientas como NVIDIA NeMo Curator, capaz de procesar millones de horas de vídeo en apenas dos semanas usando GPUs Blackwell, y con nuevos blueprints como el de manipulación robótica (GR00T), que genera movimientos sintéticos basados en demostraciones humanas.
Además, NVIDIA promueve el aprendizaje de estos entornos a través de cursos gratuitos de la Deep Learning Institute, como Learn OpenUSD y Robotics Fundamentals, dirigidos a desarrolladores de 3D, IA y automatización.
Un nuevo paradigma industrial
Lo que antes requería años de pruebas físicas ahora puede resolverse en semanas mediante simulaciones hiperrealistas. La digitalización industrial avanza hacia un futuro definido por software, donde los datos, los gemelos digitales y la IA física convergen para transformar la fabricación, la logística y la automatización a escala global.
Con estas herramientas, NVIDIA no solo impulsa la innovación, sino que propone un nuevo estándar abierto para el desarrollo seguro, eficiente y escalable de la inteligencia artificial encarnada.
vía: Nvidia