Google Translate cuenta con 110 idiomas nuevos integrados con inteligencia artificial

Google anunció que incorporó a su herramienta Translate, 110 idiomas nuevos, con su modelo de idiomas grande PaLM 2. Desde el cantonés hasta el q’eqchi’, estas nuevas lenguas representan más de 614 millones de hablantes, lo que permite traducir a alrededor del 8% de la población mundial. 

Según el buscador, algunas son importantes lenguas mundiales con más de 100 millones de hablantes. Otras son habladas por pequeñas comunidades de pueblos indígenas, y unas pocas casi no tienen hablantes nativos.

“Alrededor de una cuarta parte de las nuevas lenguas provienen de África, lo que representa nuestra mayor expansión de lenguas africanas hasta la fecha, entre ellas el fon, el kikongo, el luo, el ga, el swati, el venda y el wolof”, explica la gigante tecnológico. 

Te puede interesar: ¿Cómo instalar ChatGPT en tu Mac? Ya está disponible gratuitamente

Por otra parte, aseguró que para escoger dichas lenguas,  se enfocaron en priorizar las variedades más utilizadas de cada idioma. Por ejemplo, el romaní es un idioma que tiene muchos dialectos en toda Europa. “Nuestros modelos producen texto que es más cercano al romaní vlax del sur, una variedad que se usa comúnmente en línea”, dice. 

Google también explica que PaLM 2 fue una pieza clave del rompecabezas, ya que ayudó a Translate a aprender de manera más eficiente idiomas que están estrechamente relacionados entre sí, incluidos idiomas cercanos al hindi, como el awadhi y el marwadi, y criollos franceses como el criollo de Seychelles y el criollo de Mauricio. 

Algunos idiomas incluidos

El afar es una lengua tonal que se habla en Yibuti, Eritrea y Etiopía. De todos los idiomas que participaron en este lanzamiento, el afar fue el que recibió más contribuciones de la comunidad voluntaria.

El cantonés ha sido durante mucho tiempo uno de los idiomas más solicitados para Google Translate. Debido a que el cantonés a menudo se superpone con el mandarín en la escritura, es complicado encontrar datos y entrenar modelos.

El manés es la lengua celta de la Isla de Man. Estuvo a punto de extinguirse con la muerte de su último hablante nativo en 1974, pero gracias a un movimiento de recuperación que abarcó toda la isla, ahora hay miles de hablantes.

Te puede interesar: ¡Es un hecho! Gemini llega a Gmail, Documentos, Drive y Hojas de cálculo ¿Como usar la IA?

El NKo es una forma estandarizada de las lenguas mandinga de África occidental que unifica muchos dialectos en un idioma común. Su alfabeto único se inventó en 1949 y hoy cuenta con una comunidad de investigación activa que desarrolla recursos y tecnología para él.

Punjabi (Shahmukhi) es la variedad de punjabi escrita en escritura persoárabe (Shahmukhi), y es el idioma más hablado en Pakistán.

El tamazight (amazigh) es una lengua bereber que se habla en el norte de África. Aunque existen muchos dialectos, la forma escrita suele ser comprensible para ambas partes. Se escribe en alfabeto latino y tifinagh, ambos compatibles con Google Translate.

Imagen: Archivo ENTER.CO

Digna Irene Urrea

Digna Irene Urrea

Comunicadora social y periodista apasionada por las buenas historias, el periodismo literario y el lenguaje audiovisual. Aficionada a la tecnología, la ciencia y la historia.

View all posts

Archivos