Árbol de páginas

Versiones comparadas

Clave

  • Se ha añadido esta línea.
  • Se ha eliminado esta línea.
  • El formato se ha cambiado.

...

A continuación, se listan los metadatos a obtener de cada publicación. Aquellos que están coloreados no podrán ser modificados por el usuario:

  • Tipo de publicación[1]
  • Título
  • Abstract
  • Idioma
  • DOI
  • Fecha
  • Link
  • Palabras clave
  • Autor correspondiente
    • Nombre (lista)
    • ORCID
    • Identifier (ID en caso de no tener ORCID)
    • link
  • Conjunto de autores (por cada uno):
    • Nombre (lista)
    • ORCID
    • Identifier (ID en caso de no tener ORCID)
    • link
  • Página inicio
  • Página fin
  • Revista
    • Nombre
    • ISSN
    • ¿métrica?Métrica
  • Métrica de publicación
    • Nombre de red
    • Número de citas.


Por otro lado, todos los artículos citan y referencian a otros. Dada una publicación principal como la de arriba tenemos que poder enlazarla con los artículos citados y referenciados, que serán considerados ROs de tipo referencia o bibliografía. Estos artículos citados y referenciados pueden ser caracterizados con los mismos metadatos que un RO de tipo publicación, pero la importancia de estos es diferente, ya que no se necesita obtener tanta información de estos. En el siguiente listado se indican con colores los metadatos mínimos necesarios para caracterizar un RO de tipo referencia o bibliografía.

  • Tipo de publicación
  • Título
  • Abstract
  • ID
  • Idioma
  • DOI
  • Fecha
  • Link
  • Autor correspondiente:
    • Nombre (lista)
    • ORCID
    • Identifier (ID en caso de no tener ORCID)
    • link
  • Conjunto de autores (por cada uno):
    • Nombre (lista)
    • ORCID
    • Identifier (ID en caso de no tener ORCID)
    • link
  • Página inicio
  • Página fin
  • Revista
    • Nombre
    • ISSN
    • ¿Métrica?
  • Métrica de publicación
    • Nombre de la fuente externa
    • Número de citas

...

En las siguientes secciones se exponen diversas fuentes externas y se comentará si se va a usar o no, así como qué tipo de fuente complementaria es cada una de ellas.

...

3.12.1. PudMed

Esta fuente externa no puede ser principal porque su API no permite la consulta de publicaciones de un autor a través de ningún tipo de identificador estándar del autor (p.ej. ORCID). No existe un identificador interno para cada investigador en esta fuente externa por lo que no permite buscar por un autor a excepción de cuando se busca por su nombre. Además, los metadatos obtenidos de cada publicación son mínimos y no genéricos, por lo que no aportan información que pueda complementar a la que ya se dispone por una reclamación previa en una fuente principal que ya ha permitido obtener los metadatos mínimos de una publicación.

...

Además, la mayoría de los artículos que se encuentran en esta plataforma se pueden encontrar en otras fuentes externas como Scopus.

...

3.12.2. Semantic Scholar

Esta fuente externa no puede ser una fuente principal porque no permite pedir información de publicaciones de un usuario a través de su ORCID, si bien permite realizar dicha consulta a través de un “author_id” interno que cada investigador tiene asociado en esta fuente externa. Sin embargo, cuando devuelve información de las publicaciones de un autor, esta no incluye el DOI (identificativo estándar), lo que imposibilita complementar la información de la misma con otras fuentes externas. Por lo tanto, esta fuente externa solamente podría ser complementaria y deberá ser usada para obtener los metadatos necesarios de un artículo de tipo referencia. 

...

3.12.3. CrossRef

Esta fuente externa tampoco permite realizar peticiones con el ORCID de un autor. Además, tampoco se ha encontrado un identificativo interno de cada usuario en esta fuente externa. Por lo tanto, tampoco se podría considerar como principal.

...


3.12.4. Open Citations

Esta fuente de datos tiene la gran limitación de que solo ofrece la conexión con el DOI de los artículos que cita o referencia uno dado. Sin embargo, este metadato, como se verá en posteriores análisis, es difícil de encontrar por lo que esta fuente es primordial para conseguir esta relación entre documentos. Además, al devolvernos el DOI de un artículo nos permite completar los metadatos de esta publicación con otra fuente externa.

...


3.12.5. European PMC

Al igual que ocurre con Open Citations esta fuente está diseñada para obtener metadatos de los ROs de tipo referencia o cita. En este caso la búsqueda es un poco más enrevesada ya que en primer lugar se debe obtener el ID en la página de esta fuente externa.  Posteriormente preguntar tanto por las citas como por las referencias de este ID.

...

Tal y como se ha analizado previamente, las fuentes complementarias que se utilizarán serán Semantic Scholar, PubMed y Crossref. Scopus y WoS, OpenAIre, también se podrán usar como complementarias ya sea mediante APIs que ofrecen información de otro tipo sobre los artículos (como por ejemplo de la métrica de una revista p. ej. Web of Science Journals API) o cuando después de la llamada a las fuentes secundarias no se haya obtenido la información necesaria.

...

3.13.1 Análisis de la compatibilidad entre fuentes externas

Esta invocación ha de hacerse de forma automática teniendo en cuenta diferentes compatibilidades para determinar qué fuentes complementarias se podrán usar en cada caso:

...

  • El proceso de registrarse para acceder a la API de ORCID es complejo y hay varias opciones (Registering a Member API Client o Registering a Public API client). Estamos analizando los requisitos de cada una de las opciones y recabando la información que solicitan en su web.
    • [ACTUALIZACIÓN] Ya estamos registrados y haciendo pruebas.
  • WoS aún no ha contestado a la solicitud de registro y no tenemos acceso programático vía API-key, por lo que no se ha podido probar realmente si los resultados que se obtienen coinciden con los ejemplos de su documentación y la interfaz web de la misma. Hay muchos metadatos mínimos necesarios para una publicación que debemos comprobar si son devueltos o no, como por ejemplo los relativos a la bibliografía del artículo.
    • [ACTUALIZACIÓN] Ya estamos registrados y haciendo pruebas.
  • Determinar si las severas restricciones respecto al reducido número de consultas que permite PubMed la hacen candidata a fuente externa utilizable en Hércules.

...

3.13.2 Análisis de la compatibilidad de la fuente principal y complementaria

En la siguiente tabla se muestran en las filas las fuentes externas principales y en las columnas las fuentes externas complementarias, indicando para cada una de ellas el nombre del metadato identificativo necesario para realizar búsquedas (en las principales ID de usuario y en las complementarias IDs de publicaciones).

...


Crossref

(DOI)

PudMed

(PudMedID)

Semantic Scholar (DOI)

Scopus (2ª llamada) (Scopus_ID)

(DOI)

WoS revista

(ISSN)

Open Citation

(DOI)

European PMC

(DOI)

Scopus (1ª llamada) (ORCID)




Scopus_ID




WoS (ORCID)




DOI




ORCID (ORCID)




DOI




OpenAire

ORCID

...









3.13.3   Compatibilidad de metadatos

En este análisis se han examinado los metadatos que se pueden obtener en las fuentes externas principales y complementarias, con el fin de ver que fuente complementaria es más adecuada para completar la información que devuelve cada fuente principal.

...

Dado que estas tablas ofrecen gran cantidad de información, se documentan en ficheros Excel aparte. 

...

3.13.4  Gestión de publicaciones incompletas

En caso de que con la combinación de fuentes principales y fuentes complementarias no se llegue a cubrir la información necesaria para registrar una publicación en el grafo de conocimiento de Hércules, se analizará la posibilidad de utilizar varias fuentes complementarias a la fuente principal. Por ejemplo, si la información de la bibliografía de una publicación no está completa, se podrían invocar a microservicios de fuentes externas complementarias a través de los DOIs de los artículos presentes en la bibliografía.

...

Se recorre cada una de las publicaciones obtenidas en WoS. Por cada una de ellas:

Se almacena el DOI en una lista para saber qué artículos ya hemos completado del investigador en cuestión.

Se llama al servicio de Semantic Scholar y se fusiona la información obtenida por este microservicio y la publicación que estamos examinando (función de combinar dos publicaciones). El resultado de esta unificación será la publicación que estamos observando. Esta fuente externa nos devuelve la información de los documentos referenciados. Estas publicaciones tendrán únicamente unos pocos metadatos básicos que no serán completados con ninguna red externa adicional.

Se llama a la fuente externa Zenodo y en caso de encontrarse un fichero PDF con la publicación se añadirá como metadato.

Se llama al enriquecimiento de áreas temáticas y de palabras clave para completar la publicación.

Se añaden las métricas de las revistas.

Se recorren todos los documentos obtenidos por Scopus y para cada uno de ellos:

Si el DOI de esta publicación coincide con la publicación que estamos examinando entonces se combina la información (función de combinar dos publicaciones).

En caso contrario no se hace nada.

Se recorren todos los documentos obtenidos en OpenAire y para cada uno de ellos:

Si el DOI de esta publicación coincide con la publicación que estamos examinando entonces se combina la información (función de combinar dos publicaciones).

En caso contrario no se hace nada.

Llegados a este punto la publicación central está completa, así como todas las bibliográficas y citas que la componen. Se guarda para devolverse.

Recorremos la lista de publicaciones de Scopus con el fin de completar aquellas que no se han obtenido de WoS. Por tanto, por cada una de las publicaciones:

Si ya ha sido completada y almacenada antes, no hace nada con ella.

En caso contrario:

Se llama al servicio de Semantic Scholar y se fusiona la información obtenida por este microservicio y la publicación que estamos examinando (función de combinar dos publicaciones). El resultado de esta unificación será la publicación que estamos observando. Esta fuente externa nos devuelve la información de los documentos referenciados. Estas publicaciones tendrán únicamente unos pocos metadatos básicos que no serán completados con ninguna red externa adicional.

Se llama a la fuente externa Zenodo y en caso de encontrarse un fichero PDF con la publicación se añadirá como metadato.

Se llama al enriquecimiento de áreas temáticas y de palabras clave para completar la publicación.

Se añaden las métricas de las revistas.

Recorrimos Recorremos la lista de publicaciones de OpenAire con el fin de completar aquellas que no se han obtenido de WoS y Scopus. Por tanto, por cada una de las publicaciones:

Si ya ha sido completada y almacenada antes, no hace nada con ella.

En caso contrario:

Se llama al servicio de Semantic Scholar y se fusiona la información obtenida por este microservicio y la publicación que estamos examinando (función de combinar dos publicaciones). El resultado de esta unificación será la publicación que estamos observando. Esta fuente externa nos devuelve la información de los documentos referenciados. Estas publicaciones tendrán únicamente unos pocos metadatos básicos que no serán completados con ninguna red externa adicional.

Se llama a la fuente externa Zenodo y en caso de encontrarse un fichero PDF con la publicación se añadirá como metadato.

Se llama al enriquecimiento de áreas temáticas y de palabras clave para completar la publicación.

Se añaden las métricas de las revistas.

Llegados a este punto ya tenemos completas todas las publicaciones de este autor.

...