Árbol de páginas

Versiones comparadas

Clave

  • Se ha añadido esta línea.
  • Se ha eliminado esta línea.
  • El formato se ha cambiado.

...

Para implementar este módulo trabajamos con Camelot (biblioteca de python Python software libre GPL V3). Camelot es capaz de trabajar con tablas rotadas de diferentes formatos y, modificando ciertos parámetros internos de la propia librería es capaz de darnos resultados muy satisfactorios. Para la realización de este componente del módulo de tecnologías cognitivas se ha hecho uso de diferentes parametrizaciones de Camelot para posteriormente aplicando algoritmos propios, obtener la mejor aproximación a la tabla que contiene el documento de entrada. Esta librería tendrá como resultado, si se le pide, la salida de la tabla en formato excel Excel o csvCSV. También se ha implementado devolver la tabla resultante como un dataframe de Pandas, de esta forma otros procesos pueden extraer información que sea necesaria para la realización del Módulo de Automatización y Gestión. Desde nuestro módulo de extracción de tablas podremos llamar a las funciones de estas librerías añadiendo los parámetros necesarios para que nos devuelva el resultado .

...