Améliorer la qualité des données publiées
Dans cette section, vous apprendrez comment utiliser le validateur de données GBIF. |
Le validateur de données du GBIF est un service qui permet à toute personne ayant un jeu de données GBIF de recevoir un rapport sur la justesse syntaxique et la validité du contenu de le jeu de données. En soumettant un jeu de données au validateur, vous pouvez passer par les procédures de validation et d’interprétation généralement associées à la publication sur GBIF et déterminer rapidement les éventuels problèmes dans les données - sans avoir à les publier.
Comment ça fonctionne ?
Vous commencez en important le fichier de données dans le validateur, soit 1) en cliquant sur SÉLECTIONNER UN FICHIER et en le sélectionnant sur votre ordinateur, soit 2) en faisant glisser le fichier depuis un dossier local et en le déposant sur l’icône DÉPOSER ICI. Vous pouvez également saisir l’URL d’un fichier de données accessible depuis internet. Cette option est particulièrement utile pour les grands ensembles de données. Une fois que vous avez cliqué sur le bouton SOUMETTRE, le validateur commence à traiter votre fichier de données. Vous serez directement dirigé vers une page indiquant se statut de la validation.
Selon la taille de votre ensemble de données, le traitement peut prendre un certain temps. Il n’est pas nécessaire de garder la fenêtre du navigateur ouverte, car un ID de travail unique est émis chaque fois qu’un nouveau processus de validation est lancé. Si le traitement de votre ensemble de données prend trop de temps, il vous suffit d’enregistrer l’ID (sauvegarde de l’URL) et de l’utiliser pour revenir ultérieurement consulter le rapport. Nous conservons le rapport pendant un mois, au cours duquel vous pouvez revenir quand vous le souhaitez.
Quels types de fichiers sont acceptés ?
-
Archives Darwin Core (DwC-A) compressées en ZIP (contenant des cœurs d’occurrences, de taxons ou d’événements)
-
Modèles Excel du Kit de publication intégré (IPT) contenant les données de liste d’espèces, d’occurrences ou d’événements d’échantillonnage
-
Des fichiers CSV simples contenant les termes Darwin Core dans la première ligne
Quelles informations sont fournies à partir du rapport de validation ?
Une fois le traitement effectué, vous pourrez voir le rapport de validation contenant les informations suivantes :
-
un résumé du type de jeu de données et un indicateur simple pour savoir s’il peut être indexé par le GBIF ou non
-
un résumé des problèmes rencontrés lors de l’interprétation du jeu de données par GBIF
-
une description détaillée des problèmes trouvés dans les métadonnées, le cœur du jeux de données et dans les extensions (s’il y en a), respectivement
-
le nombre d’enregistrements interprétés avec succès
-
la fréquence des termes utilisés dans le jeu de données
Vous pourrez également consulter les métadonnées en tant que version préliminaire de la page du jeu de données telle qu’elle apparaîtra lorsque le jeu de données sera publié et enregistré auprès du GBIF.
J’ai le rapport de validation - et après ?
If the validator finds that your dataset cannot be indexed by GBIF, you should address the issues raised by the validation report before you consider publishing it to GBIF. Even if your dataset is indexable by GBIF, you should still carefully review any issues that may be the result of e.g. conversion errors, etc. which could affect the quality of the data. If you find and correct any error - from a single typo to large systematic problems - feel free to resubmit your dataset as many times you like.