Manejo de la calidad de los datos

Determinar la precisión y exactitud de los datos para su uso es un paso clave para determinar la utilidad de los datos para cualquier propósito previsto. Mientras que GBIF puede apoyar la identificación de algunos problemas de calidad que surgen del flujo de trabajo de publicación de datos, manejar algunos problemas de calidad requiere conocimientos expertos adicionales. Los dos problemas más comunes para los que esto puede ser necesario son:

  • Vacíos de datos - el muestreo entre grupos taxonómicos y regiones geográficas no es igual y los usuarios pueden necesitar tener en cuenta el sesgo de muestreo en sus análisis antes de que los datos puedan ser utilizados eficazmente.

  • Identificación taxonómica errónea - algunos grupos taxonómicos pueden requerir información adicional, para asegurar que los taxa hayan sido identificados correctamente, como imágenes, videos y grabaciones de audio que acompañan a la información asociada a los datos o colectores.

Alertas de GBIF para problemas de calidad de datos

Durante el proceso de indexación, GBIF asigna incidencias y alertas a los datos que tienen problemas comunes de calidad de datos. Éstos se producen con mayor frecuencia por errores de datos u omisión de campos cuya interpretación puede ser automatizada de forma centralizada por GBIF. Estas interpretaciones están clasificadas como

  • Excluido - cuando los datos originales no pudieron ser interpretados, por lo cual se excluyen en los campos interpretados.

  • Alterado - cuando los datos originales son modificados en el proceso de interpretación para ser indexados en GBIF.org.

  • Inferido - cuando un campo vacío es inferido usando otra información del registro.

Tenga en cuenta que si está filtrando por problemas de calidad de datos, debería revertir el filtro para excluir aquellos datos que han sido marcados con ese problema. También puede ver los datos originales, es decir, los datos no interpretados en un archivo de Darwin Core, si desea validar el proceso de interpretación.

¿Cómo puedo mejorar la calidad de los datos?

Los publicadores tienen la responsabilidad de mejorar la calidad de los datos y, como usuario, usted juega un papel clave en la identificación de errores. Si encuentra un error en los datos, debe ponerse en contacto con el publicador directamente utilizando los datos de contacto que GBIF proporciona en la página del publicador. GBIF también proporciona a los usuarios la posibilidad de registrar problemas de calidad de datos mediante el botón "Comentarios y preguntas" en la barra de menú de GBIF.org.