La tecnología de generación de voz de IA de ElevenLab se está expandiendo a 30 idiomas

ElevenLab's AI voice generation technology is expanding to 30 languages.

ElevenLabs es una startup que ha llamado la atención por su plataforma de generación de voz impulsada por IA, que se ha utilizado para narrar audiolibros y aumentar la accesibilidad al contenido, pero también se ha utilizado de forma incorrecta para hacer parecer que las figuras públicas están diciendo cosas terribles. La plataforma ahora está saliendo de la etapa beta y se está expandiendo significativamente a más idiomas.

El lunes, ElevenLabs anunció que la plataforma está saliendo de una etapa beta que comenzó en enero, y la startup también reveló un nuevo modelo de aprendizaje profundo multilingüe fundamental, Eleven Multilingual v2.

También: 4 cosas que Claude AI puede hacer que ChatGPT no puede

Eleven Multilingual v2 admite 30 idiomas y permite a las personas de todo el mundo utilizar las capacidades de texto a voz y clonación de voz de ElevenLabs.

Cuando los usuarios ingresan texto, el modelo identifica automáticamente el idioma escrito y genera el habla con “un nivel de autenticidad sin precedentes”, según el comunicado.

Las características de voz únicas del hablante, independientemente de si es una voz sintética o clonada, se mantienen iguales en los 30 idiomas, lo que garantiza el mismo estilo de habla, incluido el acento.

“ElevenLabs se inició con el sueño de hacer que todo el contenido sea universalmente accesible en cualquier idioma y en cualquier voz”, dijo Mati Staniszewski, CEO y cofundador de ElevenLabs.

“Con el lanzamiento de Eleven Multilingual v2, estamos un paso más cerca de hacer realidad este sueño y poner voces de IA de calidad humana disponibles en cada dialecto”.

También: El 40% de los trabajadores deberán adquirir nuevas habilidades en los próximos tres años debido a la IA, según un estudio de IBM

ElevenLabs identificó algunos casos de uso potenciales para esta aplicación, como permitir a los autores independientes hacer audiolibros, traducir experiencias de videojuegos y contenido de audio para audiencias internacionales, y aumentar la accesibilidad al contenido para personas con discapacidades visuales y necesidades adicionales de aprendizaje.

Como se indica en el comunicado, los idiomas admitidos incluyen coreano, holandés, turco, sueco, indonesio, vietnamita, filipino, ucraniano, griego, checo, finlandés, rumano, danés, búlgaro, malayo, húngaro, noruego, eslovaco, croata, árabe clásico, tamil, inglés, polaco, alemán, español, francés, italiano, hindi y portugués.