Árbol de páginas

Versiones comparadas

Clave

  • Se ha añadido esta línea.
  • Se ha eliminado esta línea.
  • El formato se ha cambiado.

...

Este módulo tiene como objetivo hacer minería de datos explotando los datos de los distintos subsistemas Hércules, en concreto sobre los datos de grupos de investigación y su producción con objeto de realizar clasificación y  categorización que permitan identificar agrupaciones y similaridades, para ello se hace uso de tecnologías de procesamiento de lenguaje natural (NLP) y de aprendizaje (Machine Learning). 

El funcionamiento de esta librería se divide en: 

  • Extracción de datos de los subsistemas HÉRCULES. 
  • Tratamiento de datos
  • Vectorización y creación de vocabulario (NLP) utilizando las etiquetas relacionadas con los trabajos de los investigadores. 
  • Reducción de la dimensión usando UMAP (Machine Learning)
  • Agrupación . Datos de salida. utilizando técnicas de clustering (Machine Learning)

Módulo de Tecnologías Cognitivas:  

  • Sistema de soporte a la toma de decisiones permitiendo realizar inferencias a partir de los datos recopilados Procesamiento del lenguaje natural (NLP)
  • Categorización y clasificación 
  • Hacer minería de datos sobre los datos de grupos de investigación y su producción con objeto de realizar clasificaciones y categorizaciones que permitan identificar agrupaciones y similaridades con objeto de crear mecanismos automáticos de comunicación a los  mismos, relativos a posibles informaciones relevantes sobre convocatorias, anuncios, u otras actividades científicas o de transferencia. 
  • Detección de cambios de formato Machine Learning

Más detalles en: 

https://confluence.um.es/confluence/pages/viewpage.action?pageId=397534864 

...