Uno de los grandes quebraderos de cabeza de las empresas, especialmente de las de mayor tamaño, consiste en el elevado número de documentos que manejan y que acaban acumulando. Para ello, muchas incorporan a su panoplia de soluciones digitales, aquellas destinadas a la gestión documental.
Tradicionalmente, dichas soluciones no solamente han venido almacenando los documentos, sinó también proporcionando una indexación que permite a los usuarios buscar por palabras clave. La llegada de la era de la inteligencia artificial (IA) proporciona la capacidad de llevar dichas soluciones a un nuevo nivel, permitiendo que los usuarios “interroguen” a los documentos para obtener resúmenes y datos sin tener que leerlos.
Open Contracts es una solución de software libre (se encuentra disponible para su descarga desde Internet bajo licencia Apache-2) que integra IA para facilitar la realización de consultas avanzadas sobre colecciones de documentos.
Uno de los principales componentes de Open Contracts es su Layout Parser, que extrae automáticamente las características de diseño de los archivos PDF. Esto significa que la herramienta puede identificar y extraer bloques de diseño y contenido dentro de un documento, facilitando así la navegación y el análisis de los mismos.
Además, este sistema también genera incrustaciones vectoriales automáticas para los PDFs cargados y los bloques de diseño extraídos. Esto mejora significativamente la capacidad de búsqueda y análisis, permitiendo una gestión más inteligente y eficiente de la información contenida en los documentos.
La anotación de los documentos almacenados en formato PDF también es posible a través de una interfaz dedicada.
Pero, sin lugar a dudas, una de las herramientas más poderosas que proporciona Open Contracts es su integración con LlamaIndex, gracias a la cual puede utilizar almacenes vectoriales y cualquier característica anotada manual o automáticamente, para facilitar que un modelo de lenguaje grande (LLM) pueda responder a preguntas de manera inteligente sobre el contenido de los documentos.
La capacidad de realizar consultas sobre volúmenes de documentos, es decir, consultar la documentación masiva dividida entre varios archivos distintos, es una herramienta muy útil tanto en el caso de empresas de cualquier tipo, como de bufetes de abogados, o notarías entre otros.