Árbol de páginas

Versiones comparadas

Clave

  • Se ha añadido esta línea.
  • Se ha eliminado esta línea.
  • El formato se ha cambiado.

...

https://confluence.um.es/confluence/pages/viewpage.action?pageId=397534866 

Repositorio:

https://github.com/hercules-rpa/module_cognitive_lib/blob/main/module_cognitive_treelogic/PDF2Table.py

Módulo 2 : Extracción de tablas en archivos PDF 

...

https://confluence.um.es/confluence/pages/viewpage.action?pageId=397534862 

Repositorio:

https://github.com/hercules-rpa/module_cognitive_lib/blob/main/module_cognitive_treelogic/PDF2Table.py

 

Módulo 3 : Minería de datos 

...

https://confluence.um.es/confluence/pages/viewpage.action?pageId=397534864 

Repositorio:

https://github.com/hercules-rpa/module_cognitive_lib/blob/main/module_cognitive_treelogic/DataMining.py

 

Módulo 4 : Extracción de información utilizando recorrido de documentos XML 

...

https://confluence.um.es/confluence/pages/viewpage.action?pageId=416940103 
  Repositorio:

https://github.com/hercules-rpa/module_cognitive_lib/blob/main/module_cognitive_treelogic/ExtractXML.py

Módulo 5 : Web-scraping 

El módulo cognitivo estará dotado de una librería que será capaz de recoger, agrupar y categorizar las distintas convocatorias distribuidas en las páginas que se usarán como bases de datos. Estas páginas no tienen API y por lo tanto, la única forma de atacarlas es usando web-scraping y recuperar los resultados como si de un humano se tratase.  

...

 

Tecnologías Cognitivas utilizadas: 

  • Diseño de un sistema de web-scraping para identificar anuncios de convocatorias de interés para los perfiles de investigadores desde diferentes fuentes suministradas al sistema. .


Repositorio:

https://github.com/hercules-rpa/module_cognitive_lib/blob/main/module_cognitive_treelogic/WebScrapping.py