NVIDIA ha revelado una serie de herramientas avanzadas de inteligencia artificial y simulación que prometen acelerar el desarrollo de robots humanoides y mejorar las capacidades de aprendizaje en robótica. Estas novedades, presentadas en la Conferencia de Aprendizaje en Robótica (CoRL) en Múnich, incluyen la disponibilidad general de su marco de aprendizaje robótico NVIDIA Isaac Lab, seis nuevos flujos de trabajo de aprendizaje para el desarrollo de humanoides en el Proyecto GR00T y herramientas para la creación de modelos de mundo con tecnologías como NVIDIA Cosmos y NeMo Curator.
NVIDIA Isaac Lab: el marco de aprendizaje robótico abierto
NVIDIA Isaac Lab es una plataforma de aprendizaje robótico de código abierto basada en NVIDIA Omniverse, diseñada para facilitar el desarrollo de políticas de control a escala en robots de diversas formas, desde humanoides hasta cuadrúpedos. Esta plataforma unificada permite a los desarrolladores entrenar modelos de IA para robots capaces de manejar movimientos complejos y entornos de interacción, acelerando el proceso de creación de aplicaciones robóticas.
Entre los grandes nombres de la robótica que ya han adoptado Isaac Lab se encuentran Agility Robotics, Boston Dynamics y XPENG Robotics. Con el respaldo de esta herramienta, empresas de tecnología de todo el mundo están avanzando en sus proyectos de robótica de forma más ágil y colaborativa.
Proyecto GR00T: capacidades avanzadas para robots humanoides
El Proyecto GR00T es una iniciativa de NVIDIA que busca crear un ecosistema global de desarrolladores de robots humanoides mediante la provisión de bibliotecas, modelos base y flujos de trabajo específicos para el desarrollo de robots avanzados. Los seis flujos de trabajo de GR00T están diseñados para ayudar a los desarrolladores de humanoides a superar los desafíos más complejos en este campo:
- GR00T-Gen: Generación de entornos 3D con IA generativa basada en OpenUSD.
- GR00T-Mimic: Generación de movimiento y trayectoria para robots.
- GR00T-Dexterity: Manipulación hábil y precisa.
- GR00T-Control: Control de cuerpo completo en robots.
- GR00T-Mobility: Navegación y locomoción.
- GR00T-Perception: Percepción multimodal para sensores avanzados.
Jim Fan, gerente de investigación en NVIDIA, ha destacado que los robots humanoides representan «la próxima ola de IA incorporada», y que estos flujos de trabajo están diseñados para hacer frente a las exigencias tecnológicas de esta tendencia emergente.
Herramientas avanzadas para la creación de modelos de mundo
La creación de modelos de mundo —representaciones digitales de entornos que permiten a los robots predecir cómo interactuar con objetos— es un proceso que requiere grandes cantidades de datos e importantes recursos de computación. Para hacer frente a este reto, NVIDIA ha lanzado el tokenizador Cosmos y el NeMo Curator, dos herramientas que optimizan la compresión y curación de datos de video e imágenes.
- NVIDIA Cosmos Tokenizer: Proporciona una tokenización visual de alta calidad y eficiencia, con tasas de compresión hasta 12 veces superiores a las actuales, lo que permite desarrollar aplicaciones generativas en diversos ámbitos visuales.
- NeMo Curator: Optimiza el procesamiento de datos en video a través de un pipeline automatizado y escalable, logrando procesar datos en múltiples GPU y manejando hasta 100 petabytes de información. Esta herramienta está especialmente diseñada para reducir el tiempo de desarrollo y los costos, lo que beneficia directamente a la industria de la robótica.
Eric Jang, vicepresidente de IA en 1X Technologies, expresó que el Cosmos Tokenizer permite a la empresa entrenar modelos de mundo de manera más eficiente, con una alta compresión y retención de fidelidad visual.
Fomentando la comunidad de aprendizaje en robótica
NVIDIA ha compartido 23 trabajos de investigación y ha organizado nueve talleres en el CoRL, cubriendo desde la integración de modelos de lenguaje visual hasta estrategias de planificación de tareas complejas y la adquisición de habilidades mediante demostraciones humanas. Dos de los avances más destacados incluyen SkillGen, un sistema basado en generación de datos sintéticos para entrenar robots, y HOVER, un modelo base para controlar la locomoción y manipulación en robots humanoides.
Además, la compañía está impulsando la colaboración con la comunidad de desarrolladores a través de asociaciones con Hugging Face y la creación de programas específicos como el NVIDIA Humanoid Robot Developer Program, en el cual los desarrolladores pueden acceder a recursos exclusivos y soporte especializado.
Disponibilidad y acceso
NVIDIA Isaac Lab 1.2 y el Cosmos Tokenizer ya están disponibles en GitHub y Hugging Face, mientras que NeMo Curator estará disponible a finales de mes. NVIDIA también lanzará próximamente los nuevos flujos de trabajo de Project GR00T, junto con una serie de guías y tutoriales para ayudar a los desarrolladores a integrarse en este ecosistema.
Este conjunto de herramientas no solo representa un avance tecnológico, sino también una apertura hacia un ecosistema de desarrollo más colaborativo. A través de esta combinación de IA y simulación, NVIDIA busca acelerar la evolución de la robótica y, particularmente, de los humanoides, marcando el camino hacia un futuro donde los robots sean compañeros efectivos en entornos complejos y en constante cambio.
vía: Nvidia y Noticias IA