Datos aptos para propósitos específicos

Casi siempre querrá pos-procesar su descarga de GBIF de alguna manera que se ajuste a sus propósitos. A veces, tendrá que hacer juicios difíciles para su caso de uso particular. Siempre que esté tratando con miles o millones de registros, nunca sabrá la verdadera calidad de los datos de origen. Es importante tener en cuenta que siempre está mitigando los problemas de calidad de los datos, no eliminándolos.

Los datos que obtenemos en la descarga de GBIF contendrán datos de una variedad de fuentes y es probable que los datos varíen en su exactitud y consistencia. La exactitud y la coherencia son dos formas de documentar los errores de datos y son medidas de la calidad de los datos. Estas son medidas de qué tan bien el recolector de datos pudo capturar el valor real que se estaba investigando. La naturaleza del flujo de trabajo de publicación de datos de GBIF significa que la exactitud y consistencia de los datos pueden variar según los publicadores y la fuente de los datos. Conocer estas propiedades de los datos le ayudará a comprender las formas en las que puede y no puede limpiar, validar y procesar los datos.

  • Exactitud (precisión) - proximidad de los valores, observaciones o estimaciones medidas al valor real o verdadero, ej.: se ha identificado correctamente la especie o la localidad de la colección.

Correctness

Por ejemplo, si estamos estudiando biogeografía de plantas en Indonesia, y queremos realizar un análisis específico para sólo una de las islas del archipiélago, entonces una pregunta apropiada podría ser - ¿Las localidades de la isla han sido correctamente georreferenciadas?

  • Consistencia (Precisión) - nivel de resolución de los datos, ej.: precisión de las coordenadas, determinación taxonómica.

Consistency

En el ejemplo indonesio, una pregunta apropiada podría ser: ¿La incertidumbre en la estimación de las coordenadas permite al registro de presencia no estar ubicado en la isla?

Por regla general, para la mayoría de análisis se desean datos muy precisos aunque el nivel de precisión pueda variar dependiendo del análisis. GBIF puede ayudar a determinar la precisión de los datos, por ejemplo, mediante filtros y avisos, sin embargo, ¡siempre es necesario hacer doble comprobación!