Exigences de qualité des données GBIF
Dans cette section, vous examinerez les exigences de qualité des données GBIF. |
Les éditeurs jouent un rôle essentiel non seulement dans le partage des jeux de données mais aussi dans la gestion de leur qualité, leur complétude et utilité, et assurent leur intégration et leur valeur dans la base de connaissances globale du GBIF.
Pour partager des données via GBIF.org, les fournisseurs de données doivent généralement rassembler ou transformer des jeux de données existants dans un format standardisé. Ce travail peut inclure un traitement supplémentaire, des éditions sur contenu et la conversion du contenu d’un jeu de données vers l’un des formats de transfert de données disponibles, ainsi que la publication à l’aide d’un des outils de publication de données disponibles, tels que le Kit de publication intégré (IPT) du GBIF, qui est gratuit et open-source .
Une fois publiés, l’infrastructure en temps réel du GBIF "indexe" ou "récolte" les nouveaux ensembles de données, les intégrant dans un système d’accès commun où les utilisateurs peuvent récupérer toutes les données grâce à des services communs de recherche et de téléchargement. Au fur et à mesure que les ensembles de données sont indexés, GBIF.org effectue des contrôles supplémentaires, des routines d’interprétation et de conversion pour s’assurer que les données sont interopérables et conformes aux standards minimaux de formats de données, de qualité des données et d’aptitude à l’emploi. Cependant, de nombreux critères de qualité et d’utilisation des données sont plus faciles à gérer lorsqu’ils sont traités à la source: le de données individuel.
Les fournisseurs de données jouent donc un rôle essentiel non seulement dans le partage des jeux de données, mais aussi dans la gestion de leur qualité, de leur complétude et de leur utilité ainsi que pour garantir leur intégration et leur valeur dans la base de connaissances globale du GBIF. Apprenez-en plus sur les exigences de qualité des données et sur les recommandations pour:
En pratique, nous encourageons les responsables de la publication des données à se familiariser avec les formats de données attendus et les exigences en matière de contenu le plus tôt possible dans le processus (voir également les templates Excel GBIF préconfigurés avec les termes requis et recommandés pour les jeux de données d’occurrences, les listes d’espèces, et les événements d’échantillonnage, tous disponibles avec des exemples de données). Vous économiserez ainsi beaucoup d’efforts qui pourraient être nécessaires à des étapes ultérieures, par exemple pour ajouter des conversions de données, saisir des informations pour les champs obligatoires ou fortement recommandés, ou effectuer les contrôles finaux de qualité des données avant la publication.
Les projets BID et BIFA doivent inclure leur identifiant de projet dans la partie métadonnées des jeux de données publiés. Cela permet de lier les jeux de données aux pages du projet. |