Árbol de páginas

Versiones comparadas

Clave

  • Se ha añadido esta línea.
  • Se ha eliminado esta línea.
  • El formato se ha cambiado.

Image RemovedImage Added


Descripción general del proceso.

...

Su funcionamiento comienza con la extracción de las convocatorias contenidas almacenadas en el SGI con estado REGISTRADA. Una vez obtenidas, se procesará almacenará internamente toda la información a fin de poder obtener datos tales como el área temática para poder hacer un matching entre los investigadores y la convocatoria.

Una vez extraída el área temática, se pasará como parámetro al módulo cognitivo, que devolverá una colección de investigadores. Para ello, se proporcionará una palabra clave y el área temática. La extracción de la palabra clave se realizará usando librerías de NLP, sobre el documento de la convocatoria, con el objetivo de obtener la relación semántica más cercana al área temática. En el caso de que no sea satisfactoria la extracción, la librería de módulo cognitivo permite obtener una colección de investigadores por área temática, esto da la posibilidad de notificar a los posibles investigadores relacionados con dicha convocatoria.

Posteriormente, se extraerán los tópicos de interés de los investigadores obtenidos, mediante el acceso a EDMA a través de la API facilitada por GNOSS. Si no se dispone, en las bases de datos propias de RPA, del registro de la información del investigador se llevará a cabo una inserción para poder disponer, de forma interna, de los datos asociados.  

De forma adicional, se almacenarán los datos de feedback facilitados por el investigador ya que pueden suponer un sesgo importante a la hora de ofrecer una convocatoria. En caso de disponer de datos previos en el sistema RPA, se fusionarán con la información recabada en EDMA para disponer de un abanico más amplio de datos de filtrado. 

...

con el objetivo de que los algoritmos de recomendación extraigan la información que deseen. Seguidamente, se extraerán todos los investigadores almacenados tanto internamente por la parte de RPA como en ED, en el caso de que hayan nuevos investigadores estos serán incorporados al sistema, se eliminan duplicados y los investigadores que hayan solicitado ya la convocatoria serán descartados como posibles candidatos a recomendar.

Los investigadores que se hayan insertado nuevos y no tengan un perfil configurado, el sistema tratará de cargar uno con la información en ED y SGI, en caso de que no fuera posible la carga de un perfil base por falta de información el investigador sería descartado, y el subproceso de "recordatorio de configuración de perfil" le notificará para que configure su perfil, de esta forma si el investigador establece su perfil la próxima ejecución el sistema de recomendación podría recomendarle la convocatoria que anteriormente no pudo.

Una vez extraídos los investigadores y procesados al igual que las convocatorias, esta información será introducida al sistema de recomendación el cual ejecutará los algoritmos que se describirán en detalle en las secciones posteriores, cada algoritmo tiene dos parámetros de entrada que el usuario funcional encargado del sistema debe introducir para programar la ejecución de este proceso, dichos parámetros son:

  • Activo. Valor booleano que indica si ese algoritmo debe o no ejecutarse.

  • Peso. Valor numérico cuya suma total de todos los pesos debe ser 1 e indica el peso que tiene el algoritmo a la hora de pasar los resultados al motor de recomendación (híbrido en este caso) para determinar si una convocatoria es susceptible de recomendar o no.

Una vez que los algoritmos terminen su ejecución, los datos de salida serán introducidos al motor híbrido (en la secciones posteriores se detallará su funcionamiento) que será el encargado de la decisión final. Aquellos investigadores que el sistema haya determinado que son aptos para recomendar recibirán un correo electrónico con la siguiente información de la convocatoria (pueden omitirse campos en caso de que no hayan sido introducidos en el SGI) :

  • Entidad Convocante.
  • Entidad Financiadora (podría haber más de una).
  • Tipo Financiación.
  • Porcentaje de Financiación.
  • Importe de financiación. 
  • Título.
  • Descripción.
  • Observaciones.
  • Fecha de publicación.
  • Fecha de concesión.
  • Enlace a la convocatoria (SGI).
  • Enlace para Feedback.
  • Enlace para configurar el perfil.

En la siguiente imagen podemos ver un ejemplo del formato:

Image Added

En el caso que el investigador quisiera alimentar al sistema con su feedback, este se almacenará y se tendrá en cuenta en futuras recomendaciones. La siguiente ventana muestra un feedback que se ha realizado de forma exitosa:

Image Added

En caso de que el investigador trate de realizar más de un feedback el sistema lo detectará y le mostrará el siguiente mensaje:

Image Added

Anteriormente, se ha mencionado un subproceso que hemos llamado "recordatorio de configuración de perfil", este subproceso es el encargado de notificar a aquellos investigadores que no han configurado su perfil y tampoco el sistema ha podido configurar un perfil base, la siguiente imagen muestra un ejemplo de correo recibido:

Image Added

Podemos definir su BPMN de la siguiente forma:

Image Added

La ventana de configuración de perfil mostrará al investigador el conjunto de áreas temáticas que hay dentro del SGI, de esta forma se puede establecer un perfil al investigador del que partir, sin la necesidad de enviar convocatorias que son totalmente opuestas al investigador. La siguiente imagen muestra la ventana de configuración de perfil:

Image Added

Como se puede observar existen 3 botones (la parte que aparece de Tree, son debugs, no se deben tener en cuenta):

  • Limpiar: Vuelve a poner las puntuaciones como se habían mostrado al principio de abrir la ventana.

  • Borrar datos de entrenamiento: Borra todos los datos del investigador que el sistema utilizaba dando la opción de volver a cargar el perfil base. Podemos verlo en la siguiente imagen:

Image Added

  • Enviar. Enviamos los datos al sistema, para que sean almacenados.


Sistema de recomendación.

...

Un filtro colaborativo trata de buscar similitud, cuando es basado en ítems, esa similitud se traduce a buscar ítems similares, en este caso, convocatorias. La decisión de optar por un filtro colaborativo basado en ítem y no en usuarios (similitud entre usuarios) es porque el basado en ítem se comporta mejor en muchos aspectos, por ejemplo, los investigadores pueden cambiar con el tiempo sus preferencias, pero las convocatorias serán de un determinado tipo, y además este proceso ya va a utilizar un subproceso que llama al módulo de tecnologías cognitivas que ya conoce la similitud entre investigadores.

La similitud entre convocatorias se buscará utilizando las áreas temáticas. Para ello, se tendrá en cuenta la puntuación/feedback que el investigador nos devuelve sobre una convocatoria, la cual se compone de diferentes áreas temáticas y que el investigador ha puntuado entre 1 y 5.

...

  1. Identificar si el área o áreas están calificadas por, al menos, la mitad de los investigadores. En caso de no estarlo, por heurística, se podrá determinar a quién enviar esa convocatoria, teniendo en cuenta que la puntuación sea mayor de 2.5 (siempre en base a una puntuación de 1 a 5) o si ese investigador no ha calificado nunca una de las áreas temáticas.
  2. En caso de que se disponga de las puntuaciones necesarias, se creará una matriz de correlación entre todas las áreas temáticas.
  3. Se obtendrán los investigadores y, por cada área que hayan puntuado, se seleccionarán todas las áreas similares (según nuestra matriz de correlación), se multiplicará esa puntuación por el valor de correlación, de esta forma se potencia el valor de correlación, tanto positivamente como negativamente.
  4. Se observa el resultado que se ha obtenido del área o áreas de entrada de la convocatoria, si se encuentra por encima de la media de recomendación, significa que es candidata de recomendar esa convocatoria.

¿Por qué  puntuaciones de áreas temáticas y no en la propia

...

convocatoria?

Las convocatorias tienen un periodo de solicitud, lo que da lugar a que puedan no existir suficientes solicitudes ni convocatorias para satisfacer el sistema de recomendación y que proporcione una buena probabilidad de acierto. Puede ocurrir que se tenga suficiente puntuación una vez que se haya terminado el plazo, por otro lado surge el problema de una convocatoria nueva no se sabría a quién mandarla. Se debería enviar de forma indiscriminada siempre. Las áreas temáticas, perdurarán en el tiempo y aunque aparezcan nuevas, los investigadores podrán ir puntuado esas áreas conforme vayan saliendo nuevas convocatorias, con lo que llegará un punto en que se satisfaga el requisito de mínima puntuación para utilizar el sistema de recomendación, por lo que, cuando aparezcan nuevas convocatorias, se puede determinar a quién mandarla de forma personalizada. Siguiendo este enfoque, se encontrarán relaciones entre distintas áreas temáticas que podrán ser de interés para los investigadores.

...

Los sistemas basados en contenido tienen en cuenta características de la convocatoria, por ejemplo, áreas temáticas, unidad de gestión, modelo de ejecución, palabras clave. Todos aquellos atributos que pueda puedan ser importantes para un investigador a la hora de tomar la decisión de optar por una convocatoria o por otra.
Este sistema lo que haría sería crear una matriz de similitud de las convocatorias teniendo en cuenta sus atributos, que antes de calcular la similitud se juntarían en una única columna para posteriormente vectorizarlos, y con datos suficientes de los investigadores, determinar si la convocatoria a ofrecer es similar a convocatorias anteriores. De esta forma, es posible personalizar aún más las convocatorias a notificar.

Este sistema tiene como inconveniente la dificultad para determinar qué atributos son relevantes para tener en cuenta, por lo que hace falta un experto que lo determine. Desde la UMU se han determinado que los campos a extraer para realizar este sistema de recomendación son:

  • Áreas temáticas.
  • Entidad convocante.
  • Entidad financiadora.
  • Finalidad.
  • Clasificación de producción científica.
  • Palabras clave.

Motor híbrido

Ambos sistemas si se construyen se pueden fusionar para solventar las desventajas que tienen cada uno de ellos por separado. Para ello, se tratará la puntuación que nos devuelve cada sistema para obtener un peso, y , conforme en función de ese peso, determinar si es candidata o no dicha convocatoria de entrada.

Notificación al investigador

Una vez que el sistema de recomendación ha determinado que un investigador es candidato para notificar la convocatoria, recibirá un correo electrónico informándole de esta, con los siguientes campos de dicha convocatoria:

  • Entidad convocante/financiadora,
  • Título
  • Fechas
  • Descripción 
  • Observaciones
  • Enlace

...



Enlaces a GitHub: