Données adaptées au but d’utilisation

Presque toujours vous voudrez post-traiter votre téléchargement du GBIF d’une manière ou d’une autre pour correspondre à vos objectifs. Parfois, vous devrez faire des jugements difficiles pour votre cas particulier d’utilisation. Chaque fois que vous traitez avec des milliers ou des millions d’enregistrements, vous ne connaîtrez jamais la vraie qualité des données source. Il est important de garder à l’esprit que vous ne faites qu’atténuer les problèmes de qualité des données, et non les éliminer.

Les données que nous obtenons dans le téléchargement du GBIF, contiendront des données provenant d’une gamme de sources et les données varieront probablement en termes de justesse et de cohérence. La justesse et la cohérence sont deux façons de documenter les erreurs de données et sont des mesures de la qualité des données. Ce sont des mesures qui montrent à quel point le collecteur de données a été en mesure de saisir la véritable valeur étudiée. La nature du flux de publication des données du GBIF signifie que la justesse et la cohérence des données peuvent varier selon les éditeurs de données et la source des données. Si vous connaissez ces propriétés des données que vous avez, cela vous aidera à comprendre comment vous pouvez et ne pouvez pas nettoyer, valider et traiter les données.

  • Justesse (Précision) - proximité des valeurs mesurées, des observations ou des estimations de la valeur réelle ou réelle e. . - les espèces ont été identifiées correctement ou la localité de collecte a été correctement identifiée.

Correctness

Par exemple, si nous étudions la biogéographie végétale en Indonésie, et voulons faire une analyse spécifique pour une seule des îles de l’archipel, alors une question appropriée pourrait être - Les localités de l’île ont-ils été correctement géoréférencés?

  • Cohérence (Précision) - niveau de résolution des données, par exemple précision des coordonnées, détermination taxonomique.

Consistency

Dans l’exemple indonésien, une question appropriée pourrait être - L’incertitude dans l’estimation des coordonnées permet-elle que l’occurence ne soit pas sur l’île ?

En règle générale, pour la plupart des analyses, vous voulez des données très correctes, mais le niveau de précision peut varier en fonction de votre analyse. Le GBIF peut vous aider à déterminer la justesse et la précision des données à travers, par exemple, des filtres et la signalisation de tickets, cependant, vous devez toujours vérifier à deux fois !