Con tan solo una muestra de 15 segundos la IA de OpenAI puede clonar la voz

Foto de depositphotos.com

San Francisco, California,.- OpenAI, empresa creadora del popular ChatGPT, ha revelado los últimos avances de su herramienta Voice Engine, capaz de crear voces sintéticas a partir de muestras de audio de solo 15 segundos de duración.

Según lo mostrado recientemente por la firma en su blog, el ‘software’ puede clonar «voces emotivas y realistas» mediante la inteligencia artificial (IA). La voz generada podrá leer indicaciones de texto según se le ordene en el mismo idioma que el usuario o en otra lengua deseada.

La tecnología, que comenzó a desarrollarse a fines de 2022, se encuentra con un acceso limitado para unos diez desarrolladores, señaló Jeff Harris, miembro del equipo de producto de OpenAI para Voice Engine. Por el momento, la compañía no ha revelado si planea lanzarla como un servicio accesible a todo el mundo al estilo de ChatGPT.

El sintetizador de voz podría ayudar a personas con discapacidades en el habla a expresarse con más facilidad, así como permitir la reproducción de manera casi automática de versiones dobladas en distintos idiomas de productos de audio.

Sin embargo, la firma está consciente de los riesgos que puede conllevar poner una tecnología de este tipo al alcance de cualquiera, en un contexto del auge de los ‘deepfakes’ en la Red.

En ese sentido, aseguraron que se implementó «una serie de medidas de seguridad, incluida una marca de agua para rastrear el origen de cualquier audio generado por Voice Engine, así como un monitoreo proactivo de cómo se usa el modelo». «Reconocemos que generar un discurso que se asemeje a las voces de las personas conlleva serios riesgos, que son especialmente importantes en un año electoral en Estados Unidos” indicaron los creadores, al tiempo que destacaron que tendrán en cuenta las recomendaciones del Gobierno estadounidense, medios de comunicación y el sector de educación, entre otros. (EL HERALDO)

https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices