El motor de voz de OpenAI puede clonar su voz con un clip de voz de 15 segundos

Qué saber

OpenAI tiene un modelo de motor de voz mejorado que puede clonar voces con sólo una muestra de voz de 15 segundos.
La tecnología de clonación de voz AI de OpenAI tiene implicaciones de gran alcance y la compañía está retrasando un amplio lanzamiento en ese momento.
Mientras tanto, OpenAI está implementando diversas funciones de seguridad y barandillas para identificar y realizar un seguimiento del uso de la tecnología.

El modelo de motor de voz de OpenAI, que impulsa las funciones de voz y lectura en voz alta de ChatGPT, tiene una nueva capacidad potente. Con más que una entrada de texto y una muestra de voz de 15 segundos, ahora puede generar un clon natural de una voz humana muy parecida al altavoz original. Y los resultados son terriblemente buenos.

Junto con la actualización, OpenAI compartió en su sitio web los resultados de varias pruebas de clonación de voz. Cada uno de ellos incluye un "audio de referencia" original, seguido del "audio generado" clonado. A continuación se muestran algunas muestras de lo que es capaz el modelo de Voice Engine:

Audio de referencia 1

Nuevas funciones en YouTube Music en 2024

Audio generado 1

Audio de referencia 2

Audio generado 2

Soporte técnico Hotmail (Outlook): canales de atención

Audio de referencia 3

Audio generado 3

Elimine Dar acceso a desde el menú contextual de Windows 10 - TechCult

Con posibles aplicaciones en el sector de la educación y la salud, en la traducción y en llegar a comunidades de todo el mundo, parece que la clonación de voz tiene muchos mercados esperando para tragarla. Pero las implicaciones de esa tecnología no son del todo rosas.

Las llamadas fraudulentas ya clonadas con IA están en aumento. Aunque ha habido un consenso general entre las naciones para salvaguardar a los usuarios en la era de la IA, las barandillas no se ponen tan fácilmente, sobre todo cuando la tecnología avanza.

Sin embargo, OpenAI está trabajando para implementar su propio conjunto de medidas de seguridad, "incluida la marca de agua para rastrear el origen de cualquier audio generado por Voice Engine", prohibiendo la suplantación de identidad de otra persona y requiriendo el consentimiento explícito e informado del orador original.

"Estamos adoptando un enfoque prudente e informado para un lanzamiento más amplio debido al potencial de uso indebido de la voz sintética", declaró la compañía a su publicación en el blog.

Source link

Entradas Relacionadas