Meta lanza AudioCraft, un generador de música de inteligencia artificial de código abierto.
Meta lanza AudioCraft, un generador de música de IA de código abierto.
El nuevo generador de música con IA de Meta es el último de una serie de productos de IA lanzados recientemente por la empresa tecnológica.
El miércoles, Meta anunció el lanzamiento de AudioCraft, una IA generativa de código abierto que crea audio y música a partir de indicaciones de texto. AudioCraft cuenta con tres modelos: MusicGen para componer música, AudioGen para crear efectos de sonido y EnCodec, que utiliza IA para ayudar en la compresión de audio que supera el formato MP3.
Por si te preguntabas sobre problemas de derechos de autor, MusicGen se entrenó con música propiedad de Meta y con licencia.
Meta ha estado impulsando agresivamente la incorporación de herramientas impulsadas por IA a las masas, compitiendo con OpenAI, Google y Microsoft. En julio, lanzó su Llama 2 de código abierto, la versión más reciente de su modelo de lenguaje grande (LLM, por sus siglas en inglés).
- Elon Musk cree que puede lograr que se cambie la política de la ...
- Google actualiza sus políticas sobre la pornografía de venganza en ...
- Google pronto te notificará de los resultados de búsqueda que muest...
A diferencia de GPT-4 de OpenAI y PaLM 2 de Google, Llama 2 es de código abierto, lo cual le otorga puntos a Meta entre los desarrolladores y los éticos que creen en la transparencia del desarrollo de IA. También hay rumores de que Meta lanzará “personas” de IA, también conocidas como chatbots, para Instagram, Facebook y WhatsApp.
AudioCraft fue diseñado pensando en músicos y diseñadores de sonido para “proporcionar inspiración, ayudar a las personas a generar ideas rápidamente y a iterar en sus composiciones de nuevas maneras”, según el anuncio.
Los ejemplos en la publicación del blog incluyen muestras de audio de las indicaciones “Silbando con el viento soplando” y “Canción de baile pop con melodías pegadizas, percusiones tropicales y ritmos animados, perfecta para la playa”, que… suenan exitosamente como esas descripciones.
Gran parte de los avances recientes en IA generativa se han centrado en la generación de texto e imágenes, que es un proceso más sencillo.
La conversión de texto a audio es un desafío más complicado que Meta parece haber resuelto. AudioCraft aprende tokens de audio a partir de señales en bruto utilizando su códec de audio neuronal EnCodec patentado para crear un nuevo “vocabulario” para el modelo.
Luego, entrena modelos de lenguaje sobre este vocabulario de audio para que el modelo comprenda las asociaciones entre audio y texto. Dado que AudioCraft también es de código abierto, el código está disponible en GitHub para que los usuarios lo exploren y lo prueben por sí mismos.