Nueva York, Estados Unidos.- Google ya incorporó a Google Translate más de 111 idiomas, incluyendo dialectos y lenguas de Latinoamérica, informó Business Insider.
Entre ellos están el K’iche’ y el Ta Yol Mam (Guatemala y México); el Náhuatl o Nahua, Maya, y el Zapoteco (México); el Q’eqchi (México y Belice); y el Hunsrik (Brasil).
Google también agregó idiomas de otras partes del mundo, como el cantonés y el punjabi.
Aproximadamente una cuarta parte de los nuevos idiomas disponibles en Google Translate provienen de África, lo que representa su mayor expansión de idiomas africanos hasta la fecha, incluidos fon, kikongo, luo, ga, swati, venda y wolof.
De acuerdo con Google, este es el lanzamiento más grande en Translate hasta el momento, ya que los idiomas recientemente incorporados representan a más de 660 millones de hablantes en conjunto, permitiendo traducciones para alrededor del 8 por ciento de la población mundial.
Google aclaró que la implementación de estos nuevos idiomas se hará de manera gradual entre el 27 de junio y el 7 de julio.Preserva idiomas con la IAGoogle lleva años desarrollando tecnología para conservar y divulgar la cultura lingüística de Latinoamérica y el mundo.
Este reciente anuncio forma parte de la “Iniciativa 1,000 Idiomas” que Google presentó en 2022.
Este es básicamente un compromiso de la compañía para construir modelos de IA que admitan los mil idiomas más hablados en todo el mundo.
En 2022, la compañía agregó 24 nuevos idiomas utilizando Zero-Shot Machine Translation, donde un modelo de aprendizaje automático aprende a traducir a otro idioma sin siquiera ver un ejemplo.
De acuerdo con Google, esta tecnología facilita y agiliza el proceso de incorporación de nuevos lenguajes para llegar a cada vez más comunidades.
Sobre cómo es el proceso para elegir nuevos idiomas qué agregar a Google Translate, la compañía dice que hay muchos factores a tomar en cuenta: desde qué variedades ofrecer hasta qué ortografías específicas usar.
De hecho, muchos idiomas no tienen una norma única, por lo que es imposible elegir una variedad “correcta”.
Frente a ello, el enfoque de Google ha sido priorizar las variedades más utilizadas de cada idioma. Por ejemplo, el romaní es un idioma con muchos dialectos en toda Europa, pero sus modelos de IA generan texto lo más parecido posible al romaní vacalo (o vlax) del sur, una variedad comúnmente utilizada en internet.
Sin embargo, también mezcla elementos de otros, como el romaní valaco del norte y el romaní balcánico.
A su vez, Google cuenta con alianzas con lingüistas expertos y hablantes nativos para mejorar las capacidades de sus modelos de IA enfocadas a los idiomas. (AGENCIA REFORMA)
Autor
Otros artículos del mismo autor
- MEXICO20 noviembre, 2024Pide INE postergar 90 días elección judicial
- MEXICO20 noviembre, 2024Si no pueden, renuncien, lanzan desde Acapulco
- DEPORTES20 noviembre, 2024Dan al GP de la CDMX premio Victory Prize México 2024
- MEXICO20 noviembre, 2024Biden me dijo que iba a revisar caso de ‘Mayo’.- Sheinbaum