Mejorar la calidad de los datos publicados

En esta sección, aprenderá a utilizar el validador de datos GBIF.

El validador de datos de GBIF es un servicio que permite a cualquier persona con un conjunto de datos relevante para GBIF recibir un informe sobre la corrección sintáctica y la validez del contenido del conjunto de datos. Al enviar un conjunto de datos al validador, puede pasar por los procedimientos de validación e interpretación normalmente asociados a la publicación en GBIF y determinar rápidamente los posibles problemas en los datos, sin tener que publicarlos.

datavalidator
Haga clic en el menú Herramientas del sitio web de GBIF para ir a la página del Validador de datos

¿Cómo funciona?

Para empezar, cargue el archivo del conjunto de datos en el validador: 1) haciendo clic en SELECCIONAR ARCHIVO y seleccionándolo en su equipo local o 2) arrastrando el archivo desde una carpeta local y soltándolo en el icono SOLTAR AQUÍ. También puede introducir la URL de un archivo de conjunto de datos accesible desde Internet. Esto es especialmente útil para los conjuntos de datos más grandes. Una vez que haya pulsado el botón "Enviar", el validador comenzará a procesar su archivo de conjunto de datos y le llevará directamente a una página que muestra el estado de la validación.

quality11

Dependiendo del tamaño de su conjunto de datos, el procesamiento puede llevar un tiempo. No es necesario mantener la ventana del navegador abierta, ya que se emite un ID único de trabajo cada vez que se inicia un nuevo proceso de validación. Si su conjunto de datos está tardando demasiado en procesarse, simplemente guarde el ID (guardando la URL) y utilícelo para volver más tarde a ver el informe. Guardaremos el informe durante un mes, durante el cual podrá consultarlo cuando quiera.

¿Qué tipos de archivo son aceptados?

  • Archivos de Darwin Core comprimidos por ZIP (DwC-A) (que contienen datos del registro biológico, taxón o evento)

  • Plantillas de Excel para la Herramienta de Publicación Integrada (IPT) que contengan datos de listas de especies ("Checklist"), registros biológicos, o eventos de muestreo

  • Archivos CSV simples que contienen términos de Darwin Core en la primera fila

¿Qué información se proporciona del informe de validación?

Una vez que el procesamiento haya finalizado, podrá ver el informe de validación que contiene la siguiente información:

  • un resumen del tipo de conjunto de datos y un indicador simple de si puede ser indexado por GBIF o no

  • un resumen de los problemas encontrados durante la interpretación GBIF del conjunto de datos

  • desglose detallado de los problemas encontrados en los metadatos, el núcleo del conjunto de datos y las extensiones (si las hay), respectivamente

  • número de registros interpretados con éxito

  • frecuencia de términos usados en el conjunto de datos

También podrá ver los metadatos como una versión preliminar de la página del conjunto de datos, tal y como aparecerá cuando el conjunto de datos se publique y se registre en GBIF.

quality12

Tengo el informe de validación, ¿Ahora qué?

Si el validador encuentra que su conjunto de datos no puede ser indexado por GBIF, debería solucionar los problemas planteados por el informe de validación antes de considerar su publicación en GBIF. Por otro lado, si obtiene luz verde y su conjunto de datos es indexable por GBIF, debe revisar cuidadosamente cualquier problema que pueda ser el resultado de, por ejemplo, errores de conversión, etc. que puedan afectar a la calidad de los datos. Si encuentra y corrige cualquier error (desde un simple error tipográfico hasta grandes problemas sistemáticos) no dude en volver a enviar su conjunto de datos tantas veces como quiera.