Si bien ya nos es posible (y de hace tiempo) tener el teléfono y el ordenador en catalán, no pasa lo mismo con los asistentes de voz, con los cuales debemos interactuar en lenguas como el castellano o el inglés, con alguna excepción como Google Assistant.
Debido a la creciente importancia de estos asistentes, y a que la voz puede convertirse en la próxima interfaz para los ordenadores más allá de pantalla, teclado y ratón, el Departament de la Vicepresidència i de Polítiques Digitals i Territori de la Generalitat se ha aliado con el Barcelona Supercomputing Center (BSC) para construir los elementos necesarios para dotar de compatibilidad con el catalán a los asistentes de voz, esto es, que tanto lo entiendan como que lo hablen. Dichos elementos se agrupan bajo el proyecto AINA.
Dichos recursos son tanto los diccionarios como los modelos de voz, que se realizan mediante inteligencia artificial y, a tal efecto necesitan ser entrenados. Para ello, los responsables del proyecto AINA han decidido recurrir a Common Voice, una iniciativa que recoge voces de usuarios en todas las lenguas para crear un cuerpo de datos abierto y de uso universal en aplicaciones libres. Como todos los proyectos libres y abiertos, se basa en la colaboración ciudadana, y eso es precisamente lo que solicitan los impulsores de AINA.
Así, en el sitio web habilitado, cualquier persona de cualquier área del espacio catalanoparlante, con su diversidad de dialectos y acentos, puede colaborar de dos formas distintas: validando grabaciones de voz que han hecho otros usuarios para revisar si son correctas, y realizando grabaciones nosotros mismos, leyendo unos textos preprogramados.
Lo que se hace luego con estas grabaciones es pasarlas a una red neuronal de aprendizaje profundo (deep learning) que aprende como se juntan las palabras para componer frases y, con ello, crea un modelo de la lengua catalana gracias al cual es capaz de discernir el significado de una palabra polisémica en una frase concreta por su contexto y, por lo tanto, dar respuesta a las preguntas que le hagamos.
Para lograr que el corpus de la lengua catalana se encuentre disponible a lo largo de este año, además de apelar al trabajo voluntario de la ciudadanía, la Generalitat también dotará con una partida de tres millones de Euros al BSC, multiplicando por doce el presupuesto de 2021 para la misma finalidad.