El objetivo de este módulo será el desarrollo de un componente transversal que pueda ser usado para incrementar la capacidad de automatización de los procesos que se llevarán a cabo en el proyecto RPA-Hércules. Se necesita por tanto dotar al proyecto HÉRCULES de herramientas que flexibilicen el trabajo sobre datos como documentos sin formato o procesado de texto en imágenes. Entre otras técnicas cognitivas a utilizar se incluirán:
- Reconocimiento Óptico de Caracteres (OCR).
- Analítica de textos .
- Categorización.
- Clasificación.
- Detección de cambios de formato.
Este módulo contará con modelos de aprendizaje automático con carácter general, así como de procesado de lenguaje natural. El resultado final será un prototipo que permita la incorporación de estas tecnologías y herramientas para facilitar la detección y posterior automatización de actividades en la Universidad de Murcia, incluyendo mecanismos para dar soporte a la toma de decisiones.
Usando este módulo, se desarrollarán una serie de componentes demostradores sobre los sistemas de HÉRCULES como:
- Diseño de un sistema de web scrapping para identificar anuncios de convocatorias de interés para los perfiles de investigadores desde diferentes fuentes suministradas al sistema.
Rastrear los cambios que se produzcan en los diferentes componentes del proyecto Hércules (EDMA, ASIO y SGI), para generar informes e indicadores de tendencias, usos, incidencias, y en general identificar patrones generales de funcionamiento.
- Hacer minería de datos sobre los datos de grupos de investigación y su producción con objeto de realizar clasificaciones y categorizaciones . Estas técnicas permitirán identificar agrupaciones y similaridades con objeto de crear mecanismos automáticos de comunicación entre distintos grupos de investigación, relativos a posibles informaciones relevantes sobre convocatorias, anuncios, u otras actividades científicas o de transferencia.