Tabla de contenidos |
---|
Formato de la información
El proceso comienza con la unificación de los ficheros Excel con los datos de las revistas de WoS y Scopus en un ÚNICO fichero llamado "Revistas.xlsx". El formato sería el siguiente:
- El archivo resultante tiene que tener la extensión .xlsx
- El fichero únicamente tendrá una hoja llamada "revistas" con los datos indicados.
- La tabla debe tener el siguiente formato:
- TITLE: Nombre completo de la revista. (texto)
- PUBLISHER_NAME: Nombre completo del publicador/editor de la revista. (texto)
- ISSN: Identificador ISSN de la revista. Importante que esté formado por 8 dígitos separados por un ‘-’ en el cuarto. En el caso que no tengan, se dejará vacío. (texto) Ejemplo: 1234-5678
- EISSN: Identificador EISSN de la revista. Importante que esté formado por 8 dígitos separados por un ‘-’ en el cuarto. En el caso que no tengan, se dejará vacío. (texto) Ejemplo: 8765-4321
- CATEGORY_DESCRIPTION: Nombre de la categoría que tiene la revista. (texto)
- IMPACT_FACTOR: Factor de impacto de la revista en la categoría. (decimal)
- RANK: Posición dónde se sitúa la revista en la categoría. (numérico)
- RANK_OUT_OF: Número total de revistas que hay en la categoría. (numérico)
- QUARTILE_RANK: Cuartil de la revista en esa categoría. Ha de ser un número entre el 1 y el 4. (numérico)
- SOURCE: Fuente del dato de la revista. Posibles valores: 'WOS' o 'SCOPUS'
- YEAR: Año del dato de la revista. (numérico) Ejemplo: 2010
Proceso de comprobación de los ficheros Excel de los orígenes de datos
Para conseguir un fichero unificado con datos válidos hay que conseguir que las revistas no estén duplicadas y que sus datos sean coherentes. Para detectar posibles problemas en los datos hay que revisar los siguientes aspectos en cada fichero fuente y entre los dos orígenes de información (WoS y Scopus):
- Que el ISSN y EISSN estén bien formados. 8 dígitos separados por un ‘-’ en el cuarto. Ejemplo: 1234-5678
- Que la misma revista no cambie de ISSN y EISSN de un año a otro.
- En el caso de que el ISSN o EISSN hubieran cambiado, habría que actualizar al nuevo dato en las revistas de los años anteriores.
- Que la revista no esté en categorías duplicadas en el mismo año.
- En el caso de que se encontrasen duplicados, habría que decidir con cual de los dos registros quedarse y eliminar el otro.
Proceso de carga
El programa desarrollado leerá un único fichero y cargará los datos en la BBDD. Para considerar que dos revistas son iguales, aplicamos estas condiciones:
- Si tienen el mismo ISSN.
- Si el título y el editor es el mismo.
- Si el título y el EISSN es el mismo.
Condiciones de carga de los datos
Para realizar la carga de los datos el programa desarrollado exige que los datos cumplan las siguientes condiciones:
- El título y el publicador de la revista son obligatorios.
- Las revistas han de tener ISSN o EISSN (o ambos). Si los dos campos están vacíos, se considera una revista no válida.
- Si una revista tiene el mismo ISSN y EISSN, se considera que la revista únicamente tiene EISSN.
- No puede existir un registro con los mismos valores en 'TITLE', 'PUBLISHER_NAME', 'ISSN', 'EISSN', 'SOURCE', 'YEAR' y el mismo 'CATEGORY_DESCRIPTION'.