
NVIDIA presenta Nemotron 3 Nano Omni para agentes multimodales más rápidos
NVIDIA ha presentado Nemotron 3 Nano Omni, un modelo abierto multimodal diseñado para que los agentes de inteligencia artificial puedan razonar sobre vídeo, audio, imágenes, documentos y texto dentro de un único sistema. La promesa principal de la compañía es clara: sustituir arquitecturas con varios modelos separados por una sola capa de percepción y razonamiento capaz de reducir latencia, costes y pérdida de contexto. El lanzamiento apunta a uno de los problemas prácticos de la IA agéntica en empresas. Muchos sistemas actuales usan un modelo para visión, otro para voz, otro para lenguaje y, en algunos casos, más componentes para documentos, interfaces o extracción de datos. Esa fragmentación obliga a hacer varias pasadas de inferencia, aumenta el coste y puede




