Árbol de páginas

Versiones comparadas

Clave

  • Se ha añadido esta línea.
  • Se ha eliminado esta línea.
  • El formato se ha cambiado.

...

Por último, el sistema de recomendación determinará que investigadores son los adecuados para mandar una notificación sobre la convocatoria y en la misma notificación un botón/enlace para que nos devuelve un feedback positivo o negativo sobre la convocatoria.

Diseño Base de Datos.

La realización de este proceso conllevará el desarrollo de un esquema base de datos, con el fin de almacenar toda la información de las convocatorias notificadas, y de la puntuación que el investigador proporcione al sistema en forma de feedback, para mejorar de esta forma el sistema de recomendaciones. También, se propone el almacenamiento del feedback de la convocatoria, no solamente el del área temática, el cual será el usado en este proceso. De esta forma, al tratarse de un proyecto open source dejamos abierta la posibilidad de que un tercero pueda obtener los datos de puntuación de los investigadores respecto a las convocatorias, y mejorar el sistema de recomendación haciendo analítica de lenguaje natural basándose en los documentos y textos de las convocatorias.

...


Sistema de recomendación.

Image Added

El sistema de recomendación intentará personalizar al máximo lo que ofrece a cada investigador. Esto solo será posible cuando hayamos generado los datos suficientes para poder utilizar el motor de recomendación y obtener una buena tasa de acierto.

Existen diferentes tipos de motores, a destacar:

  • Basado en contenido: A partir de convocatorias solicitadas, intentar ofrecer convocatorias similares.
  • Filtro colaborativo: Más novedoso que el anterior, utiliza la información de todos los investigadores para identificar similitudes. Dos grandes tipos: basado en usuarios (investigadores) y basado en ítems (convocatorias).
  • Híbridos: Los sistemas de recomendación híbridos tratan de solventar las desventajas que tienen los diferentes motores tratando de “fusionarlos”.

Para la realización de este proceso se va a crear un motor de recomendación que utiliza filtro colaborativo basado en ítems, con la posibilidad de realizar un segundo motor de recomendación basado en contenido, fusionando con el anterior para crear un motor híbrido más potente.

Filtro colaborativo: basado en ítem

Un filtro colaborativo trata de buscar similitud, cuando es basado en ítems, esa similitud se traduce a buscar ítems parecidos, en este caso convocatorias. La decisión de optar por un filtro colaborativo basado en ítem y no en usuarios (similitud entre usuarios) es porque el basado en ítem se comporta mejor en muchos aspectos, por ejemplo, los investigadores pueden cambiar con el tiempo sus preferencias, pero las convocatorias serán de un determinado tipo, y además este proceso ya va a utilizar un subproceso que llama al módulo de tecnologías cognitivas que ya conoce la similitud entre investigadores.

La similitud entre convocatorias la buscaremos utilizando las áreas temáticas, para ello tendremos en cuenta la puntuación/feedback que el investigador nos devuelve sobre una convocatoria, la cual se compone de diferentes áreas temáticas y el investigador ha puntuado entre 0 y 5.

Por tanto, podemos descomponerlo de la siguiente forma la construcción de este motor de recomendación:

  1. Identificar si el área o áreas están calificadas por al menos la mitad de los investigadores, en caso contrario por heurística podemos determinar a quien mandamos esa convocatoria, teniendo en cuenta que la puntuación sea mayor de 2.5 (siempre basándonos en una puntuación de 0 a 5) o si ese investigador no ha calificado nunca una de las áreas temáticas.
  2. En caso de que si dispongamos de las puntuaciones necesarias, crearemos una matriz de correlación entre todas las áreas temáticas.
  3. Obtenemos los investigadores y por cada área que hayan puntuado, obtenemos todas las áreas similares (según nuestra matriz de correlación), multiplicaremos esa puntuación por el valor de correlación, de esta forma potenciamos el valor de correlación, tanto positivamente como negativamente.
  4. Vemos el resultado que obtenemos del área o áreas de entrada de la convocatoria, si se encuentra por encima de la media de recomendación, significa que es candidata de recomendar esa convocatoria.

¿Por qué nos basamos en las puntuaciones de las áreas temáticas y no en la propia convocatorias?

Las convocatorias tienen un periodo de solicitud, probablemente no existan suficientes solicitudes ni convocatorias para satisfacer el sistema de recomendación y que proporcioné una buena probabilidad de acierto, porque puede ocurrir que se tenga suficiente puntuaciones una vez que se ha terminado el plazo, por otro lado surge el problema de una convocatoria nueva no sabríamos a quien mandarla, tendríamos mandarla de forma indiscriminada siempre, mientras que si utilizamos las áreas temáticas, que perdurarán en el tiempo y aunque aparezcan nuevas, los investigadores podrán ir puntuado esas áreas conforme vayan saliendo nuevas convocatorias, llegará un punto en que se satisfaga el requisito de mínima puntuación para utilizar el sistema de recomendación, por lo que cuando aparezcan nuevas convocatorias sabríamos a quien mandarla de forma personalizada. Esta forma de realizarlo podremos encontrar también relación entre distintas áreas temáticas que puede ser interesante para los investigadores.

Sistema basado en contenido

Los sistemas basados en contenido tienen en cuenta características de la convocatoria, por ejemplo, áreas temáticas, unidad de gestión, modelo de ejecución, palabras clave. Todos aquellos atributos que pueda ser importante para un investigador a la hora de tomar la decisión de optar por una convocatoria o por otra.

Este sistema lo que haría sería crear una matriz de similitud de las convocatorias teniendo en cuenta sus atributos (anteriormente mencionados), que antes de calcular la similitud se juntarían en una única columna para posteriormente vectorizarlos, y con datos suficientes de los investigadores podremos determinar si la convocatoria a ofrecer es similar a convocatorias anteriores, de esta forma es posible personalizar aún más las convocatorias que notifiquemos.

Este sistema tiene el inconveniente de que no es fácil determinar que atributos son relevantes para tener en cuenta, por lo que hace falta un experto que lo determine, por lo que hasta que no se haga un análisis más en profundidad no se determinará si merece la pena llevarlo a cabo. 

Motor híbrido

Ambos sistemas si se construyen se pueden fusionar para solventar las desventajas que tienen cada uno de ellos por separado. Para ello, podemos tratar la puntuación que nos devuelve cada sistema para obtener un peso, y conforme ese peso determinar si es candidata o no dicha convocatoria de entrada. Este motor híbrido únicamente se realizará si se crea el sistema basado en contenido.

Image Added

Módulo de tecnologías cognitivas

En este proceso, para hacer aún más “inteligente” la recomendación, haremos uso del módulo de tecnologías cognitivas, con la finalidad de obtener los investigadores relacionados con otros investigadores que han realizado solicitud de las convocatorias, y que no hemos notificado porque los sistemas han determinado que no es candidata, de esta forma podremos notificar con un mensaje al investigador diciendo “Investigadores relacionados han solicitado por esta convocatoria”, y presentársela, de esta forma haremos al proceso aún más dinámico.