Árbol de páginas

Estás viendo una versión antigua de esta página. Ve a la versión actual.

Comparar con el actual Ver el historial de la página

« Anterior Versión 6 Siguiente »


Descripción general del proceso.

Este proceso es el encargado de desarrollar un sistema de recomendaciones con el objetivo de poder ofrecer a los investigadores las convocatorias disponibles de la forma más personalizada posible. 

Su funcionamiento comienza con la extracción de las convocatorias contenidas en el SGI. Una vez obtenidas, se procesará la información a fin de poder obtener datos tales como el área temática para poder hacer un matching entre los investigadores y la convocatoria.

Una vez extraída el área temática, se pasará como parámetro al módulo cognitivo, que devolverá una colección de investigadores. Para ello, se proporcionará una palabra clave y el área temática, la extracción de la palabra clave se realizará usando librerías de NLP sobre el documento de la convocatoria, con el objetivo de obtener la relación semántica más cercana al área temática, en el caso de que no sea satisfactoria la extracción, la librería de módulo cognitivo permite obtener una colección de investigadores por área temática, esto da la posibilidad de notificar a los posibles investigadores relacionados con dicha convocatoria.

Posteriormente, se extraerán los tópicos de interés de los investigadores obtenidos, mediante el acceso a EDMA a través de la API facilitada por GNOSS. Si no se dispone, en las bases de datos propias de RPA, del registro de la información del investigador se llevará a cabo una inserción para poder disponer, de forma interna, de los datos asociados.  

De forma adicional, se almacenarán los datos de feedback facilitados por el investigador ya que pueden suponer un sesgo importante a la hora de ofrecer una convocatoria. En caso de disponer de datos previos en el sistema RPA, se fusionarán con la información recabada en EDMA para disponer de un abanico más amplio de datos de filtrado. 

Por último, el sistema de recomendación determinará que investigadores son los adecuados para mandar una notificación sobre la convocatoria y en la misma notificación un botón/enlace para que nos devuelve un feedback positivo o negativo sobre la convocatoria.


Sistema de recomendación.

El sistema de recomendación intentará personalizar al máximo lo que ofrece a cada investigador. Esto solo será posible cuando hayamos generado los datos suficientes para poder utilizar el motor de recomendación y obtener una buena tasa de acierto.

Existen diferentes tipos de motores, a destacar:

  • Basado en contenido: A partir de convocatorias solicitadas, intentar ofrecer convocatorias similares.
  • Filtro colaborativo: Más novedoso que el anterior, utiliza la información de todos los investigadores para identificar similitudes. Dos grandes tipos: basado en usuarios (investigadores) y basado en ítems (convocatorias).
  • Híbridos: Los sistemas de recomendación híbridos tratan de solventar las desventajas que tienen los diferentes motores tratando de “fusionarlos”.

Para la realización de este proceso se va a crear un motor de recomendación que utiliza filtro colaborativo basado en ítems, con la posibilidad de realizar un segundo motor de recomendación basado en contenido, fusionando con el anterior para crear un motor híbrido más potente.

Filtro colaborativo: basado en ítem

Un filtro colaborativo trata de buscar similitud, cuando es basado en ítems, esa similitud se traduce a buscar ítems parecidos, en este caso convocatorias. La decisión de optar por un filtro colaborativo basado en ítem y no en usuarios (similitud entre usuarios) es porque el basado en ítem se comporta mejor en muchos aspectos, por ejemplo, los investigadores pueden cambiar con el tiempo sus preferencias, pero las convocatorias serán de un determinado tipo, y además este proceso ya va a utilizar un subproceso que llama al módulo de tecnologías cognitivas que ya conoce la similitud entre investigadores.

La similitud entre convocatorias la buscaremos utilizando las áreas temáticas, para ello tendremos en cuenta la puntuación/feedback que el investigador nos devuelve sobre una convocatoria, la cual se compone de diferentes áreas temáticas y el investigador ha puntuado entre 0 y 5.

Por tanto, podemos descomponerlo de la siguiente forma la construcción de este motor de recomendación:

  1. Identificar si el área o áreas están calificadas por al menos la mitad de los investigadores, en caso contrario por heurística podemos determinar a quien mandamos esa convocatoria, teniendo en cuenta que la puntuación sea mayor de 2.5 (siempre basándonos en una puntuación de 0 a 5) o si ese investigador no ha calificado nunca una de las áreas temáticas.
  2. En caso de que si dispongamos de las puntuaciones necesarias, crearemos una matriz de correlación entre todas las áreas temáticas.
  3. Obtenemos los investigadores y por cada área que hayan puntuado, obtenemos todas las áreas similares (según nuestra matriz de correlación), multiplicaremos esa puntuación por el valor de correlación, de esta forma potenciamos el valor de correlación, tanto positivamente como negativamente.
  4. Vemos el resultado que obtenemos del área o áreas de entrada de la convocatoria, si se encuentra por encima de la media de recomendación, significa que es candidata de recomendar esa convocatoria.

¿Por qué nos basamos en las puntuaciones de las áreas temáticas y no en la propia convocatorias?

Las convocatorias tienen un periodo de solicitud, probablemente no existan suficientes solicitudes ni convocatorias para satisfacer el sistema de recomendación y que proporcioné una buena probabilidad de acierto, porque puede ocurrir que se tenga suficiente puntuaciones una vez que se ha terminado el plazo, por otro lado surge el problema de una convocatoria nueva no sabríamos a quien mandarla, tendríamos mandarla de forma indiscriminada siempre, mientras que si utilizamos las áreas temáticas, que perdurarán en el tiempo y aunque aparezcan nuevas, los investigadores podrán ir puntuado esas áreas conforme vayan saliendo nuevas convocatorias, llegará un punto en que se satisfaga el requisito de mínima puntuación para utilizar el sistema de recomendación, por lo que cuando aparezcan nuevas convocatorias sabríamos a quien mandarla de forma personalizada. Esta forma de realizarlo podremos encontrar también relación entre distintas áreas temáticas que puede ser interesante para los investigadores.

Sistema basado en contenido

Los sistemas basados en contenido tienen en cuenta características de la convocatoria, por ejemplo, áreas temáticas, unidad de gestión, modelo de ejecución, palabras clave. Todos aquellos atributos que pueda ser importante para un investigador a la hora de tomar la decisión de optar por una convocatoria o por otra.

Este sistema lo que haría sería crear una matriz de similitud de las convocatorias teniendo en cuenta sus atributos (anteriormente mencionados), que antes de calcular la similitud se juntarían en una única columna para posteriormente vectorizarlos, y con datos suficientes de los investigadores podremos determinar si la convocatoria a ofrecer es similar a convocatorias anteriores, de esta forma es posible personalizar aún más las convocatorias que notifiquemos.

Este sistema tiene el inconveniente de que no es fácil determinar que atributos son relevantes para tener en cuenta, por lo que hace falta un experto que lo determine, por lo que hasta que no se haga un análisis más en profundidad no se determinará si merece la pena llevarlo a cabo. 

Motor híbrido

Ambos sistemas si se construyen se pueden fusionar para solventar las desventajas que tienen cada uno de ellos por separado. Para ello, podemos tratar la puntuación que nos devuelve cada sistema para obtener un peso, y conforme ese peso determinar si es candidata o no dicha convocatoria de entrada. Este motor híbrido únicamente se realizará si se crea el sistema basado en contenido.

Módulo de tecnologías cognitivas

En este proceso, para hacer aún más “inteligente” la recomendación, haremos uso del módulo de tecnologías cognitivas, con la finalidad de obtener los investigadores relacionados con otros investigadores que han realizado solicitud de las convocatorias, y que no hemos notificado porque los sistemas han determinado que no es candidata, de esta forma podremos notificar con un mensaje al investigador diciendo “Investigadores relacionados han solicitado por esta convocatoria”, y presentársela, de esta forma haremos al proceso aún más dinámico.









  • Sin etiquetas