...
A continuación, se detallará el funcionamiento de esta librería, que podemos dividirlo se divide en:
- Extracción de datos de los subsistemas HÉRCULES.
- Tratamiento de datos
- Agrupación
- Datos de salida
- Planificación
...
La extracción de datos que se busca es aquella donde se relacione: investigador, área temáticas y descriptor. Para ello, haremos se hará uso del lenguaje SPARQL, realizando la siguiente query:
Bloque de código | ||||
---|---|---|---|---|
| ||||
select ?person ?tag ?nombreCategoria ?nombrePersona ?email from <http://gnoss.com/document.owl> from <http://gnoss.com/person.owl> from <http://gnoss.com/taxonomy.owl> where { ?doc a <http://purl.org/ontology/bibo/Document>. ?doc <http://purl.org/ontology/bibo/authorList> ?autor. ?autor <http://www.w3.org/1999/02/22-rdf-syntax-ns#member> ?person. ?person <http://xmlns.com/foaf/0.1/name> ?nombrePersona. ?person <https://www.w3.org/2006/vcard/ns#email> ?email. ?doc <http://vivoweb.org/ontology/core#freeTextKeyword> ?tag. ?doc <http://w3id.org/roh/hasKnowledgeArea> ?area. ?area <http://w3id.org/roh/categoryNode> ?nodo. ?nodo <http://www.w3.org/2008/05/skos#prefLabel> ?nombreCategoria. } |
Esta query nos query devolverá la siguiente información:
Nombre | Descripción |
---|---|
tag | Descriptor/palabra clave |
nombreCategoria | área temática relacionada |
nombrePersona | Nombre completo del investigador |
email del investigador |
Una vez obtenemos obtenidos los datos, el orden natural en el análisis de datos es hacer un preprocesado, donde limpiamos se limpiarán aquellos datos que pueden entorpecer el entendimiento de los mismos.
...