Árbol de páginas

Estás viendo una versión antigua de esta página. Ve a la versión actual.

Comparar con el actual Ver el historial de la página

« Anterior Versión 11 Siguiente »


Descripción general del proceso.

Este proceso es el encargado de desarrollar un sistema de recomendaciones con el objetivo de poder ofrecer a los investigadores las convocatorias disponibles de la forma más personalizada posible. 

Su funcionamiento comienza con la extracción de las convocatorias contenidas en el SGI. Una vez obtenidas, se procesará la información a fin de poder obtener datos tales como el área temática para poder hacer un matching entre los investigadores y la convocatoria.

Una vez extraída el área temática, se pasará como parámetro al módulo cognitivo, que devolverá una colección de investigadores. Para ello, se proporcionará una palabra clave y el área temática. La extracción de la palabra clave se realizará usando librerías de NLP, sobre el documento de la convocatoria, con el objetivo de obtener la relación semántica más cercana al área temática. En el caso de que no sea satisfactoria la extracción, la librería de módulo cognitivo permite obtener una colección de investigadores por área temática, esto da la posibilidad de notificar a los posibles investigadores relacionados con dicha convocatoria.

Posteriormente, se extraerán los tópicos de interés de los investigadores obtenidos, mediante el acceso a EDMA a través de la API facilitada por GNOSS. Si no se dispone, en las bases de datos propias de RPA, del registro de la información del investigador se llevará a cabo una inserción para poder disponer, de forma interna, de los datos asociados.  

De forma adicional, se almacenarán los datos de feedback facilitados por el investigador ya que pueden suponer un sesgo importante a la hora de ofrecer una convocatoria. En caso de disponer de datos previos en el sistema RPA, se fusionarán con la información recabada en EDMA para disponer de un abanico más amplio de datos de filtrado. 

Por último, el sistema de recomendación determinará qué investigadores son los adecuados para mandar una notificación sobre la convocatoria y en la misma notificación un botón/enlace para que nos devuelve un feedback positivo o negativo sobre la convocatoria.


Sistema de recomendación.

El sistema de recomendación intentará personalizar al máximo lo que ofrece a cada investigador. Esto solo será posible cuando se hayan generado suficientes datos como para poder utilizar el motor de recomendación y obtener una buena tasa de acierto.

Existen diferentes tipos de motores de entre los que cabe destacar:

  • Basado en contenido: a partir de convocatorias solicitadas, intentar ofrecer convocatorias similares.
  • Filtro colaborativo: más novedoso que el anterior, utiliza la información de todos los investigadores para identificar similitudes. Dos grandes tipos: basado en usuarios (investigadores) y basado en ítems (convocatorias).
  • Híbridos: los sistemas de recomendación híbridos tratan de solventar las desventajas que tienen los diferentes motores tratando de “fusionarlos”.

Para la realización de este proceso se va a crear un motor de recomendación híbrido, fusionando el sistema basado en contenido y filtro colaborativo de esta forma el proceso de recomendación es más completo y personalizado, ya que la desventajas de un sistema serán cubiertas por las ventajas del otro.

Filtro colaborativo: basado en ítem

Un filtro colaborativo trata de buscar similitud, cuando es basado en ítems, esa similitud se traduce a buscar ítems similares, en este caso, convocatorias. La decisión de optar por un filtro colaborativo basado en ítem y no en usuarios (similitud entre usuarios) es porque el basado en ítem se comporta mejor en muchos aspectos, por ejemplo, los investigadores pueden cambiar con el tiempo sus preferencias, pero las convocatorias serán de un determinado tipo, y además este proceso ya va a utilizar un subproceso que llama al módulo de tecnologías cognitivas que ya conoce la similitud entre investigadores.

La similitud entre convocatorias se buscará utilizando las áreas temáticas. Para ello, se tendrá en cuenta la puntuación/feedback que el investigador nos devuelve sobre una convocatoria, la cual se compone de diferentes áreas temáticas y el investigador ha puntuado entre 1 y 5.

Por tanto, se puede descomponer de la siguiente forma la construcción de este motor de recomendación:

  1. Identificar si el área o áreas están calificadas por, al menos, la mitad de los investigadores. En caso de no estarlo, por heurística, se podrá determinar a quién enviar esa convocatoria, teniendo en cuenta que la puntuación sea mayor de 2.5 (siempre en base a una puntuación de 1 a 5) o si ese investigador no ha calificado nunca una de las áreas temáticas.
  2. En caso de que se disponga de las puntuaciones necesarias, se creará una matriz de correlación entre todas las áreas temáticas.
  3. Se obtendrán los investigadores y, por cada área que hayan puntuado, se seleccionarán todas las áreas similares (según nuestra matriz de correlación), se multiplicará esa puntuación por el valor de correlación, de esta forma se potencia el valor de correlación, tanto positivamente como negativamente.
  4. Se observa el resultado que obtenido del área o áreas de entrada de la convocatoria, si se encuentra por encima de la media de recomendación, significa que es candidata de recomendar esa convocatoria.

¿Por qué  puntuaciones de áreas temáticas y no en la propia convocatorias?

Las convocatorias tienen un periodo de solicitud, lo que da lugar a que puedan no existir suficientes solicitudes ni convocatorias para satisfacer el sistema de recomendación y que proporcione una buena probabilidad de acierto. Puede ocurrir que se tenga suficiente puntuación una vez que se haya terminado el plazo, por otro lado surge el problema de una convocatoria nueva no se sabría a quién mandarla. Se debería enviar de forma indiscriminada siempre. Las áreas temáticas, perdurarán en el tiempo y aunque aparezcan nuevas, los investigadores podrán ir puntuado esas áreas conforme vayan saliendo nuevas convocatorias, con lo que llegará un punto en que se satisfaga el requisito de mínima puntuación para utilizar el sistema de recomendación, por lo que, cuando aparezcan nuevas convocatorias, se puede determinar a quién mandarla de forma personalizada. Siguiendo este enfoque, se encontrarán relaciones entre distintas áreas temáticas que podrán ser de interés para los investigadores.

Sistema basado en contenido

Los sistemas basados en contenido tienen en cuenta características de la convocatoria, por ejemplo, áreas temáticas, unidad de gestión, modelo de ejecución, palabras clave. Todos aquellos atributos que pueda ser importantes para un investigador a la hora de tomar la decisión de optar por una convocatoria o por otra.
Este sistema lo que haría sería crear una matriz de similitud de las convocatorias teniendo en cuenta sus atributos, que antes de calcular la similitud se juntarían en una única columna para posteriormente vectorizarlos, y con datos suficientes de los investigadores, determinar si la convocatoria a ofrecer es similar a convocatorias anteriores. De esta forma, es posible personalizar aún más las convocatorias a notificar.

Este sistema tiene como inconveniente la dificultad para determinar qué atributos son relevantes para tener en cuenta, por lo que hace falta un experto que lo determine. Desde la UMU se han determinado que los campos a extraer para realizar este sistema de recomendación son:

  • Áreas temáticas
  • Entidad convocante
  • Entidad financiadora
  • Finalidad
  • Clasificación de producción científica
  • Palabras clave

Motor híbrido

Ambos sistemas si se construyen se pueden fusionar para solventar las desventajas que tienen cada uno de ellos por separado. Para ello, se tratará la puntuación que nos devuelve cada sistema para obtener un peso, y, conforme ese peso, determinar si es candidata o no dicha convocatoria de entrada.

Notificación al investigador

Una vez que el sistema de recomendación ha determinado que un investigador es candidato para notificar la convocatoria, recibirá un correo electrónico informándole de esta, con los siguientes campos de dicha convocatoria:

  • Entidad convocante/financiadora,
  • Título
  • Fechas
  • Descripción 
  • Observaciones
  • Enlace

En este correo también se notificará al investigador que puede configurar su perfil de recomendación, indicando que áreas temáticas prefiere puntuándolas de 1 a 5, de esta forma el sistema necesitará menos tiempo para enviar convocatorias de interés.








  • Sin etiquetas