Actualizado el 26/11/2024

icon Facebook icon Twiiter icon RSS icon EMAIL
  1. Portada
  2. >
  3. Noticias
  4. >
  5. El traductor de Google ya aprende lenguas por sí mismo

El traductor de Google ya aprende lenguas por sí mismo

Escrito por Guillem Alsina el 31/05/2022 a las 21:04:57
1282

Si usted, estimado lector, es aficionado a la buena ciencia ficción televisiva o cinematográfica y está familiarizado con la saga Star Trek, sin duda recordará uno de los gadgets futuristas más icónicos del universo creado por Gene Roddenberry: el traductor universal.


Este inexistente cachivache es capaz de traducir un gran número de lenguas, tanto terrestres como de fuera del planeta, para facilitar la comunicación de los humanos con otras especies. E, incluso, de aprender lenguas por sí sólo mediante ciertos análisis.


Una tecnología similar es la que ha desarrollado e implementado Google en su traductor automático, y que le permite aprender el idioma y, a partir de aquí, empezar a realizar traducciones, sin emplear comparativas. Es decir, que al traductor de Google ya no le hace falta una “Piedra de Rosetta”, un texto en el idioma que se quiere aprender y en otro conocido, sinó que puede trabajar con textos en un sólo idioma para aprenderlo.


Dicha tecnología, bautizada como Zero-Shot Machine Translation utiliza el machine learning, una forma de inteligencia artificial que, en este caso concreto, permite aprender a partir de pocos textos escritos disponibles, ya que las poblaciones que hablan estas lenguas no están muy digitalizadas o despliegan su actividad en Internet mayoritariamente en otras lenguas.


Para estos casos, se hace necesario encontrar textos que no contengan injerencias de otras lenguas, ni jerga coloquial, y que estén escritos con corrección, lo que es todavía más difícil en el caso de lenguas con pocos recursos online.


Google también dispone de la tecnología LangID (identificador de lengua) que le permite identificar automáticamente la lengua en la que está escrito un texto. Para detectar las lenguas poco utilizadas, ha necesitado potenciarlo y entrenar la IA que lo sustenta, todavía más.


A partir de aquí, el modelo de lengua se entrena eliminando partes del texto que el motor de inferencia debe reconstruir a medida que va aprendiendo. Es decir, es como un ejercicio de deducción en el que cuanto más aprende el sistema, mayores posibilidades tiene de deducir las partes del texto que faltan.


Hasta 24 lenguas se han añadido al traductor automático de Google gracias a esta tecnología como, por ejemplo, el Mizo, hablado por una comunidad de 800.000 personas en el noreste de la India, o el Lingala, con 45 millones de hablantes repartidos por el centro de África.


Si bien los resultados del uso de esta tecnología son prometedores, no son perfectos, aunque es de esperar que como cualquier tecnología, la Zero-Shot Machine Translation vaya mejorando con el tiempo, el uso y el desarrollo, y acabe por mejorar notablemente.