Recibe toda la actualidad del sector tech y cloud en tu email de la mano de RevistaCloud.com.

Suscripción boletín

Fugatto: La herramienta de Inteligencia Artificial que revoluciona la creación de sonido

NVIDIA ha presentado Fugatto, un innovador modelo de Inteligencia Artificial (IA) diseñado para transformar y generar sonidos de una manera nunca antes vista. Considerado como el «navaja suiza del sonido», este sistema permite a los usuarios controlar el audio mediante descripciones textuales, abriendo un abanico de posibilidades en el ámbito de la música, el cine, la educación y los videojuegos.

Una nueva era en la creación de sonido

A diferencia de otros modelos de IA enfocados en la composición musical o modificación de voces, Fugatto destaca por su versatilidad y precisión. Bautizado como Foundational Generative Audio Transformer Opus 1, es capaz de generar mezclas de música, voces y sonidos a partir de descripciones textuales y archivos de audio. Entre sus funcionalidades destacan la capacidad de crear melodías desde cero, añadir o eliminar instrumentos en una canción existente, modificar el acento o la emoción de una voz e incluso generar sonidos completamente nuevos.

Ido Zmishlany, productor musical multi-platino y cofundador de One Take Audio —empresa del programa NVIDIA Inception para startups innovadoras—, describió el modelo como «increíble». “La posibilidad de crear sonidos completamente nuevos en el estudio es revolucionaria. Esto marca un nuevo capítulo en la historia de la música”, afirmó.

Potencial en múltiples sectores

Fugatto no solo es una herramienta para músicos. Entre los casos de uso destacan:

  • Producción musical: Compositores pueden prototipar canciones, probar diferentes estilos e instrumentos, y mejorar la calidad de audio de pistas existentes.
  • Publicidad: Agencias pueden personalizar campañas adaptando voces con diferentes acentos y emociones para audiencias específicas.
  • Educación: Herramientas de aprendizaje de idiomas pueden usar voces personalizadas, como las de familiares o amigos.
  • Videojuegos: Desarrolladores pueden modificar sonidos pregrabados o generar nuevos efectos sonoros en tiempo real según las acciones del jugador.

Tecnología detrás del avance

Fugatto emplea 2.500 millones de parámetros y fue entrenado en sistemas NVIDIA DGX con 32 GPUs NVIDIA H100 Tensor Core. Su capacidad para combinar instrucciones de forma creativa —como generar una voz con acento francés y tono melancólico— es posible gracias a técnicas como ComposableART. Además, puede interpolar sonidos en el tiempo, permitiendo la creación de paisajes sonoros dinámicos, como tormentas que se disipan en amaneceres llenos de cantos de aves.

El modelo también destaca por su capacidad de realizar tareas para las que no fue específicamente entrenado, como generar voces cantadas de alta calidad a partir de simples descripciones textuales.

Una colaboración global

El desarrollo de Fugatto, liderado por un equipo diverso de investigadores de países como India, Brasil, China, Jordania y Corea del Sur, tomó más de un año. El equipo trabajó con millones de muestras de audio para entrenar al modelo, ampliando su alcance y precisión sin necesidad de añadir datos adicionales.

Según Rafael Valle, director de investigación aplicada en audio de NVIDIA y uno de los responsables del proyecto, “Fugatto representa un paso hacia un futuro donde el aprendizaje multitarea no supervisado en síntesis y transformación de audio emerja de los datos y la escala del modelo”.

Innovación que inspira

Los desarrolladores de Fugatto han experimentado momentos únicos durante el proceso de creación. Uno de ellos fue cuando el modelo respondió a un comando para generar música electrónica con ladridos de perros sincronizados al ritmo. “Cuando el equipo estalló en carcajadas, supe que habíamos logrado algo especial”, recordó Valle.

Fugatto promete transformar la forma en que se crea y percibe el sonido, consolidándose como una herramienta esencial para artistas y creativos de todo el mundo. NVIDIA sigue demostrando su liderazgo en el uso de la IA para empujar los límites de la innovación tecnológica.

vía: noticias inteligencia artificial