...
https://confluence.um.es/confluence/pages/viewpage.action?pageId=397534866
Repositorio:
Módulo 2 : Extracción de tablas en archivos PDF
...
https://confluence.um.es/confluence/pages/viewpage.action?pageId=397534862
Repositorio:
Módulo 3 : Minería de datos
...
https://confluence.um.es/confluence/pages/viewpage.action?pageId=397534864
Repositorio:
Módulo 4 : Extracción de información utilizando recorrido de documentos XML
...
https://confluence.um.es/confluence/pages/viewpage.action?pageId=416940103
Repositorio:
Módulo 5 : Web-scraping
El módulo cognitivo estará dotado de una librería que será capaz de recoger, agrupar y categorizar las distintas convocatorias distribuidas en las páginas que se usarán como bases de datos. Estas páginas no tienen API y por lo tanto, la única forma de atacarlas es usando web-scraping y recuperar los resultados como si de un humano se tratase.
...
- https://confluence.um.es/confluence/pages/viewpage.action?pageId=397534869
- https://confluence.um.es/confluence/pages/viewpage.action?pageId=397534871
Tecnologías Cognitivas utilizadas:
- Diseño de un sistema de web-scraping para identificar anuncios de convocatorias de interés para los perfiles de investigadores desde diferentes fuentes suministradas al sistema. .
Repositorio: