Noticias IBL | Nueva York
OpenAI compartió una vista previa de un modelo llamado Voice Engine, que permite a los usuarios cargar una muestra de voz de 15 segundos para generar una copia sintética.
Aún no hay una fecha para la disponibilidad pública, como dice OpenAI “está adoptando un enfoque cauteloso e informado para un lanzamiento más amplio debido al potencial de uso indebido de voz sintética”.
“Cualquier implementación amplia de tecnología de voz sintética debe ir acompañada de experiencias de autenticación de voz que verifiquen que el hablante original está agregando conscientemente su voz al servicio y una lista de voces prohibidas que detecte y evite la creación de voces demasiado similares a figuras destacadas”, afirmó la empresa.
Esta herramienta, que lleva aproximadamente dos años en desarrollo, funciona como una expansión de la API de conversión de texto a voz existente de la empresa.
OpenAI ha estado probando esta herramienta con un pequeño grupo de socios, pensando en cómo se puede utilizar para el bien en diversas industrias.
El laboratorio de investigación con sede en San Francisco compartió algunos de los primeros ejemplos, incluido el suministro de respuestas personalizadas en tiempo real y asistencia de lectura a niños y no lectores a través de sonidos naturales.
Otro uso es ayudar a los pacientes que sufren afecciones del habla repentinas o degenerativas a recuperar la voz. El Instituto de Neurociencias Norman Prince de Lifespan estaba explorando el uso de la IA en contextos clínicos.
Uno de los primeros en adoptar es HeyGen. Utiliza Voice Motor para traducir la voz de un locutor de video en varios idiomas, preservando el acento nativo del usuario original.
.