Árbol de páginas

Estás viendo una versión antigua de esta página. Ve a la versión actual.

Comparar con el actual Ver el historial de la página

« Anterior Versión 5 Siguiente »

El módulo cognitivo estará dotado de una librería que será capaz de encontrar relaciones entre los distintos investigadores entre una o varias áreas temáticas. Para ello, se usará la herramienta de creación de clustering del proyecto EDMA, proporcionada por GNOSS. Su uso facilitará la comunicación/notificación a investigadores que puedan tener relaciones con un área de interés, para así mostrarle convocatorias, noticias u otro tipo de anuncios. Esta librería, la cual será un wrapper de la herramienta de EDMA, nos proporcionará el poder desarrollar procesos mucho más completos y detallados. Por ejemplo, en el caso de encaje entre convocatorias e investigadores del Módulo B, este proceso se apoyará en el uso de esta librería.

El funcionamiento de esta librería será el siguiente:

Extracción de datos de los subsistemas HÉRCULES.

La extracción de datos que se busca es aquella donde se relacione:  investigador, área temáticas y descriptor. Para ello, haremos uso del lenguaje SPARQL, realizando la siguiente query:

Query SPARQL
select ?person ?tag  ?nombreCategoria ?nombrePersona ?email count(distinct ?doc) as ?num from <http://gnoss.com/document.owl> from <http://gnoss.com/person.owl> from <http://gnoss.com/taxonomy.owl> where {
?doc a <http://purl.org/ontology/bibo/Document>.
?doc <http://purl.org/ontology/bibo/authorList> ?autor.
?autor <http://www.w3.org/1999/02/22-rdf-syntax-ns#member> ?person.
?person <http://xmlns.com/foaf/0.1/name> ?nombrePersona.
?person <https://www.w3.org/2006/vcard/ns#email> ?email.
?doc <http://vivoweb.org/ontology/core#freeTextKeyword> ?tag.
?doc <http://w3id.org/roh/hasKnowledgeArea> ?area.
?area <http://w3id.org/roh/categoryNode> ?nodo.
?nodo <http://www.w3.org/2008/05/skos#prefLabel> ?nombreCategoria.
}order by desc(?num)

Esta query nos devolverá la siguiente información:

NombreDescripción
tagDescriptor/palabra clave
área temáticaárea temática relacionada
nombrePersonaNombre completo del investigador
Emailemail del investigador

Una vez obtenemos los datos, el orden natural en el análisis de datos es hacer un preprocesado, donde limpiamos aquellos datos que pueden entorpecer el entendimiento de los mismos. En este caso, los datos ya están tratados  pues vienen de los subsistemas HÉRCULES donde ya se hace un preprocesamiento, por tanto, el siguiente paso más próximo será la clasificación y agrupación, el objetivo es poder obtener una colección de investigadores a través del descriptor y el área temática. En las siguientes secciones se detallará como se llevará esto a cabo.

Clasificación y agrupación


  • Sin etiquetas