Noticias IBL | Nueva York
Meta anunció este mes el lanzamiento de SeamlessM4T, un modelo de IA de código abierto que puede traducir y transcribir 100 idiomas a través de texto y voz.
Está disponible junto con un nuevo conjunto de datos de traducción llamado SeamlessM4T. Según Meta, este es un “avance significativo” en el campo de la conversión de voz a voz y de voz a texto impulsada por IA.
“Nuestro modelo único proporciona traducciones bajo demanda que permiten a las personas que hablan diferentes idiomas comunicarse de manera más efectiva”, dijo Meta a TechCrunch.
Varias empresas, como Google, Amazon, Microsoft, OpenAI y varias nuevas empresas, están invirtiendo recursos en el desarrollo de sofisticadas herramientas de traducción y transcripción de IA.
Google está creando un “modelo de voz universal”, un modelo que puede comprender los 1.000 idiomas más hablados del mundo.
Mientras tanto, Mozilla encabezó Common Voice, una de las mayores colecciones de voces en varios idiomas para entrenar algoritmos de reconocimiento automático de voz.