...
Este módulo tiene como objetivo hacer minería de datos explotando los datos de los distintos subsistemas Hércules, en concreto sobre los datos de grupos de investigación y su producción con objeto de realizar clasificación y categorización que permitan identificar agrupaciones y similaridades, para ello se hace uso de tecnologías de procesamiento de lenguaje natural (NLP) y de aprendizaje (Machine Learning).
El funcionamiento de esta librería se divide en:
- Extracción de datos de los subsistemas HÉRCULES.
- Tratamiento de datos
- Vectorización y creación de vocabulario (NLP) utilizando las etiquetas relacionadas con los trabajos de los investigadores.
- Reducción de la dimensión usando UMAP (Machine Learning)
- Agrupación . Datos de salida. utilizando técnicas de clustering (Machine Learning)
Módulo de Tecnologías Cognitivas:
- Sistema de soporte a la toma de decisiones permitiendo realizar inferencias a partir de los datos recopilados Procesamiento del lenguaje natural (NLP)
- Categorización y clasificación
- Hacer minería de datos sobre los datos de grupos de investigación y su producción con objeto de realizar clasificaciones y categorizaciones que permitan identificar agrupaciones y similaridades con objeto de crear mecanismos automáticos de comunicación a los mismos, relativos a posibles informaciones relevantes sobre convocatorias, anuncios, u otras actividades científicas o de transferencia.
- Detección de cambios de formato Machine Learning
Más detalles en:
https://confluence.um.es/confluence/pages/viewpage.action?pageId=397534864
...