Árbol de páginas

Versiones comparadas

Clave

  • Se ha añadido esta línea.
  • Se ha eliminado esta línea.
  • El formato se ha cambiado.

...

Se muestran en la siguiente tabla los resultados obtenidos para el dataset de papers:


BoF (en)

Descriptors BoF (en)

SBert (en)

SBert mpnet (en)

SBert (es-en)

Avg P@5

0.55

0.28

0.93

0.88

0.77

Tabla 1: Resultados (Precision at 5) para rankings de los cinco paper más similares de 20 papers. BoF (en) corresponde a la variante 1 del primer enfoque, y Descriptores BoF (en) a la segunda variante. SBert (en) y SBert mpnet (en) corresponden a la primera variante del primer enfoque. SBert mpnet está ajustado con más tupla de ejemplo. SBert (es-en) corresponde a la variante 2 evaluado sobre la muestra de documentos iniciales en castellano.

Los experimentos sobre los restantes ROs y cruces entre ellos se encuentran en curso.


Selección de descriptores relevantes a relación de similitud semántica

...

  • Enfoque basado en intersección de descriptores: La selección de descriptores relevantes a la relación de similitud entre los textos D1 y D2 corresponde a la intersección de los conjuntos de descriptores de D1 y D2.
  • Enfoque basado en bi-encoders neuronales: La selección de descriptores relevantes a la relación de similitud entre los textos D1 y D2 corresponde a los descriptores de D1 y D2 semánticamente más próximos a la representación semántica promedio de los textos D1 y D2. Las representaciones semánticas de los descriptores y de los textos se determinarán mediante bi-encoders neuronales ajustados a la tarea de similitud semántica.

La implementación de los enfoques está finalizada y los experimentos están en curso.


Presentación de ROs similares. Recursos relacionados

La presentación de ROs similares se realiza en la ficha de una publicación y en la de un RO, en la pestaña relacionados.

El proceso sería

Tenemos 3 casos:

  • El usuario investigador con login llega a la ficha web de uno de sus ROs (publicación o de otro tipo) en su Gestión de FAIR ROs. En la pestaña "Relacionados" se muestra un listado de 20 (como máximo) ROs que tienen una relación de similitud  con el RO cuya ficha se está visualizando. Entre los ROs relacionados no se incluirán los ROs del propio investigador.
  • El usuario investigador con login llega a la a ficha web de un RO del que no es autor. Como en el caso anterior, se muestra un listado de ROs relacionados de los que el usuario investigador no es autor.
  • El usuario anónimo llega a la ficha web de un RO. En este caso se muestra una lista de ROs relacionados sin restricciones de autoría. Se propone la existencia de una cache que contenga estos ROs relacionados y que caduque a las 24h, para evitar un recálculo continuo de las recomendaciones en cada visita para usuarios anónimos y BOTs de indexación.

En los 3 casos se presenta, mediante un resaltado de los descriptores específicos, aquellos que son relevantes a la similitud según el enfoque técnico resultante indicado anteriormente en este documento en la "Selección de descriptores relevantes a relación de similitud semántica". Hemos propuesto un resaltado muy ligero en el que sólo cambia el color de la fuente de los descriptores relevantes.