En un proyecto desarrollado conjuntamente con la multinacional de la informática Microsoft y el prestigioso MIT (Instituto de Tecnología de Massachusetts, por sus siglas en inglés), el Proyecto Gutenberg ha anunciado la publicación de varios miles de audiolibros libres y gratuitos.
El Proyecto Gutenberg hunde sus raíces en 1971 como una iniciativa para proporcionar libros libres y gratuitos en formato electrónico, basándose en aquellos ejemplares de la literatura universal impresos, que no estén ya sujetos a derechos de propiedad intelectual, o bien que el detentor los haya cedido para poder distribuirlos públicamente. Es, pues, una suerte de biblioteca pública, pensada sobretodo para dotar de acceso al conocimiento a aquellas personas con menos recursos, ya que solamente hace falta un dispositivo conectado y un software, que puede ser un lector de formatos EPUB o, incluso, HTML (lo cual nos permite emplear software libre y gratuito para la lectura).
Pero, pese al esfuerzo de abrir los libros a todo el mundo, el desconocimiento de la lengua escrita o su pobre dominio, puede ser, en algunos lugares del mundo, una barrera para acceder a toda esta fuente de conocimiento, algo que soluciona un audiolibro (audiobook en inglés). Además, también tenemos la comodidad de las personas invidentes o con dificultades de visión que, gracias a un audiolibro, pueden disfrutar de contenidos literarios en viajes o en sus momentos de ocio.
La creación de un audiolibro incurre en unos mayores costes que la de un libro de texto escrito convencional, ya que hay que contratar a las personas que grabarán las voces, y hacerlo en un entorno adecuado, como un estudio de grabación. Además, la edición y el montaje (es imposible hacerlo todo de una tirada) suponen una enorme dedicación en horas.
Así que, para disminuir costes, y teniendo en cuenta el progreso que han experimentado la inteligencia artificial y la síntesis de voz en estos últimos años, el siguiente paso era lógico: que sea la IA la que genere los audiolibros.
Para su generación, el MIT y Microsoft han creado una nueva tecnología de translación de texto a voz basada en redes neuronales, que podemos encontrar perfectamente descrita en el paper Large-Scale Automatic Audiobook Creation, publicado por varios autores, y que ha trabajado sobre el extenso catálogo del Proyecto Gutenberg.
Dicha tecnología -como ya explicita el título del paper- permite la generación automática de audiolibros de alta calidad a partir de textos online, pudiendo trabajar en paralelo en centenares de libros simultáneamente.
También ofrece a los usuarios la capacidad de personalizar la velocidad de la voz y el estilo del habla, la emoción que da a la entonación (útil, por ejemplo, en los diálogos de las obras teatrales, o en las novelas de misterio) o, incluso, puede imitar una voz concreta si se le proporciona una pequeña muestra.
Los interesados más “manitas” pueden descargar este software a partir del repositorio disponible en GitHub, y crear así sus propios audiolibros.
Desde la iniciativa advierten que algunos de estos audiolibros pueden contener errores, pronuncias raras, lenguaje ofensivo (hay que tener en cuenta que algunos de los libros tienen décadas o, incluso siglos, así que vienen de un tiempo en el que las costumbres y los usos sociales eran distintos), o contenido no adecuado para todas las audiencias.