...
Se muestran en la siguiente tabla los resultados obtenidos para el dataset de papers:
BoF (en) | Descriptors BoF (en) | SBert (en) | SBert mpnet (en) | SBert (es-en) | |
Avg P@5 | 0.55 | 0.28 | 0.93 | 0.88 | 0.77 |
Tabla 1: Resultados (Precision at 5) para rankings de los cinco paper más similares de 20 papers. BoF (en) corresponde a la variante 1 del primer enfoque, y Descriptores BoF (en) a la segunda variante. SBert (en) y SBert mpnet (en) corresponden a la primera variante del primer enfoque. SBert mpnet está ajustado con más tupla de ejemplo. SBert (es-en) corresponde a la variante 2 evaluado sobre la muestra de documentos iniciales en castellano.
Los experimentos sobre los restantes ROs y cruces entre ellos se encuentran en curso.
Selección de descriptores relevantes a relación de similitud semántica
...
- Enfoque basado en intersección de descriptores: La selección de descriptores relevantes a la relación de similitud entre los textos D1 y D2 corresponde a la intersección de los conjuntos de descriptores de D1 y D2.
- Enfoque basado en bi-encoders neuronales: La selección de descriptores relevantes a la relación de similitud entre los textos D1 y D2 corresponde a los descriptores de D1 y D2 semánticamente más próximos a la representación semántica promedio de los textos D1 y D2. Las representaciones semánticas de los descriptores y de los textos se determinarán mediante bi-encoders neuronales ajustados a la tarea de similitud semántica.
...
- .
Presentación de ROs similares. Recursos relacionados
...