Árbol de páginas

Versiones comparadas

Clave

  • Se ha añadido esta línea.
  • Se ha eliminado esta línea.
  • El formato se ha cambiado.

...

La carga inicial de datos va a consistir en obtener obtiene todos los datos posibles disponibles de los investigadores que estén en la universidad con el fin de unificarlos y centralizarlos en el grafo. 

...

. La carga tiene 3 pasos:

  1. Carga de datos de los sistemas de la UMU o del SGI.
  2. Carga de datos de fuentes externas de publicaciones científicas.
  3. Carga de datos de CVs del PDI.

1. Carga de datos - UMU / SGI

Los datos que se cargan son los siguiente:

...

De momento, estos datos se cargan desde unos archivos proporcionados en formato XMLs, si bien en un futuro llegarán desde Hércules SGI, junto con otras información del personal investigador, como puesto de trabajo, formación académica, actividad docente, etc.

En estos datos no se aplica desambiguación ya que va a ser el primer paso y asumimos que dichos datos sean son correctos.

2. Carga de datos - Fuentes externas 

La incorporación de publicaciones de fuentes externas tiene 2 pasos:

...

Personas 

 

 

 

Propiedad 

Tipodesambiguación 

Score positivo 

Score negativo 

Nombre Completo 

Nombres 

1 

 

ORCID 

Identifier 

 

 

Identificador FigShare 

Identifier 

 

 

Identificador GitHub 

Identifier 

 

 

Identificador Zenodo 

Identifier 

 

 

Coautores 

ItemList 

0.5 

 

Documentos 

ItemList 

0.5 

 

Organizacion 

ItemList 

0.5 

 

Departamento 

ItemList 

0.5 

 

Grupos 

ItemList 

0.5 

 

Proyectos 

ItemList 

0.5 

 

3. Carga de datos - CV 

A partir El resto de datos de los investigadores provendrán de un CV conjunto de CVs en el formato PDF-CVN definido por la norma CVN de FECYT.

A partir de cada PDF-CVN se obtiene  un XML con los datos del personal investigador. Tanto el PDF-CVN como el archivo XML siguen la norma CVN de FECYT.

El servicio ofrecido por FECYT para transformar el formato PDF de los CV a XML es el siguiente: https://integraciones.cvnet.es/cvn2RootBean_v1_4_3/services/Cvn2RootBean?wsdl

, también expresado en el formato CVN de FECYT.

De cada fichero XML obtenido Del fichero XML se extraen los datos de los diferentes ítems del CV de la persona y se almacenan en el grafo. Si los datos del XML coincidieran con los existentes en el sistema tras los 2 pasos anteriores, se actuaría del siguiente modo, según estén o no validados los datos previos:

...

Para la desambiguación de los datos, se compararán diferentes atributos en cada ítem diferentes atributos, para comprobar si presentan la suficiente semejanza como para considerar que los recibidos en el XML y los almacenados previamente en BBDD son iguales.

...