El nuevo modelo de IA de Meta puede traducir el habla de más de 100 idiomas: una revolución en la traducción.

Meta ha lanzado un nuevo modelo de IA que puede traducir el habla en 101 idiomas diferentes, marcando un avance hacia la interpretación simultánea en tiempo real. A diferencia de los modelos de traducción tradicionales, que convierten el habla en texto y luego traducen ese texto a otro idioma, el modelo de Meta, SeamlessM4T, permite una traducción directa de voz a voz. Este modelo, descrito en un artículo publicado en Nature (artículo en español), promete una mayor eficiencia y precisión en la traducción.

SeamlessM4T ofrece más precisión que los modelos existentes y puede traducir a 36 idiomas. En comparación, el modelo de Google, AudioPaLM, puede manejar más idiomas en total, pero solo los traduce al inglés. El proceso clave de SeamlessM4T es un método llamado minería de datos paralela, el cual encuentra instancias en las que el audio coincide con un texto en otro idioma extraído de datos de la web. El modelo aprendió a asociar el audio en un idioma con las piezas de texto correspondientes en otro. Esto abrió una gran cantidad de ejemplos de traducciones para su modelo.

Los modelos de inteligencia artificial tienen muchos más ejemplos para entrenar en algunos idiomas que en otros. Esto significa que los modelos actuales de traducción de voz a voz pueden traducir un idioma como el francés al inglés, donde puede haber muchos ejemplos, pero no pueden traducir de amárico al francés. El equipo detrás de SeamlessM4T buscó resolver este problema preentrenando el modelo con millones de horas de audio hablado en diferentes idiomas. Este preentrenamiento le permitió reconocer patrones generales en el lenguaje, facilitando el procesamiento de idiomas menos hablados, ya que ya tenía una base sobre cómo debería sonar el lenguaje hablado.

Según el artículo científico, a pesar de los avances en la traducción automática, los traductores humanos siguen siendo esenciales para abordar contextos culturales y garantizar que se mantenga el significado en los diferentes lenguajes. La investigación destaca la importancia de la supervisión humana, especialmente en campos críticos como la medicina y el derecho, donde errores de traducción pueden tener consecuencias graves. Aunque el sistema Seamless es de código abierto y promete un futuro de interpretación instantánea, algunos expertos son escépticos sobre su utilidad en comparación con alternativas más rápidas y eficientes.

El sistema es de código abierto, lo que los investigadores esperan que fomente que otros construyan sobre sus capacidades actuales. Lo más emocionante del sistema de Meta es que apunta a la posibilidad de interpretación instantánea entre idiomas en un futuro no muy lejano.

Enlaces Relacionados (en español):

La Nueva IA de Traducción de Meta es Casi un Pez Babel – IEEE.org

La Nueva IA de Meta Traduce el Habla en Tiempo Real en Más de 100 Idiomas – SingularityHub.com

Comentarios en Bluesky