NVIDIA presenta un nuevo modelo de inteligencia artificial capaz de generar música y modificar voces

NVIDIA ha presentado su nueva IA generativa capaz de crear canciones y modificar voces. El fabricante de chips debe encontrar la forma de evitar los problemas por los derechos de autor.
NVIDIA ha presentado por sorpresa un nuevo modelo de inteligencia artificial conocido como Fugatto que puede crear voces, canciones y efectos de sonido a partir de una descripción de texto. El fabricante de procesadores ha ido más allá con la IA generativa y también permite editar audios ya existentes.
La compañía asegura que Fugatto (acrónimo de Foundational Generative Audio Transformer Opus 1) es "la máquina de música más flexible del mundo". Nvidia ha invertido en este sistema durante años y ha llegado a desarrollar diferentes modelos que producen música o voces a partir de texto, pero ninguno tan completo.
La empresa de Jensen Huang consigue un nivel de personalización nunca visto gracias a un profundo entrenamiento. Utiliza datos de código abierto con 2.500 millones de parámetros que se han introducido desde servidores DGX con 32 aceleradores H100.
NVIDIA ha utilizado una técnica nueva conocida como ComposableART durante el entrenamiento para combinar las instrucciones de texto con las que antes solo se podía interactuar por separado. Fugatto puede comprender las peticiones de los usuarios y crear nuevas piezas de audio sin replicar los datos con los que ha sido entrenado.
Fugatto ha empezado a crear canciones y audios
La IA de Nvidia ha empezado a crear composiciones basándose en el texto de los usuarios. Si le pides que genere un audio con el sonido de la lluvia con pájaros de fondo y una explosión al final, mezclará la información para la que ha sido entrenada en cuestión de segundos.
Permite editar el resultado sobre la marcha, modificando la descripción del texto o añadiendo nuevos efectos y quitando otros. Nvidia ha presentado otras funciones como cargar audios desde el dispositivo o aislar las pistas de voces e instrumentos durante la demostración de esta inteligencia artificial.
¿Legará Fugatto a España? Nvidia ha anunciado la versión definitiva de su IA de edición de audio, pero no ha confirmado cuándo llegará a todos los usuarios, ni siquiera si podría ser un simple experimento.
NVIDIA pretende evitar las críticas de los artistas
La empresa de Jensen Huang no ha sido clara por el momento con la llegada de Fugatto a todos los usuarios, y los analistas apuntan que no se trata de un capricho. Nvidia conoce las limitaciones de derechos de autor y las últimas críticas de la industria musical a este tipo de herramientas.
Más de 200 artistas se han unido este año para lanzar una carta impulsada por la organización sin ánimo de lucro Artist Rights Alliance acusando a la inteligencia artificial de "devaluar la música", entre ellos Billie Eilish, Nicki Minaj, Katy Perry o Luis Fonsi. Otras grandes discográficas como Universal Music Group también han criticado el nuevo rumbo de la IA.
Algunas aplicaciones como Udio y Suno AI se enfrentan a denuncias por presunta violación de los derechos de autor. Google ha seguido una estrategia similar a Nvidia con su app MusicLM, una IA que también puede producir canciones a partir de texto. Los de Mountain View no la lanzarán al público hasta que no encuentren una solución al posible plagio.
