Rubrique de gestion des données

Gestion des données

Compétences Performance de début 1 Développement de la performance 2 Performance accomplie 3 Performance exceptionnelle 4

A. Capacité à évaluer la qualité (c.-à-d. Identifier les problèmes et leurs types) d’un jeu de données sur la biodiversité.

Utilise seulement des contrôles visuels pour analyser la qualité. Incapable de différencier les types d’erreurs. Peut détecter les valeurs manquantes dans les champs obligatoires et les incohérences graves des données.

Ne peut utiliser que des techniques très basiques (par exemple le tri) pour analyser la qualité des données. Peut détecter les incohérences entre les noms de champs et le contenu. Peut identifier de manière cohérente les erreurs techniques, mais uniquement les erreurs de cohérence les plus courantes dans un jeu de données.

Peut utiliser des outils et des techniques spécifiques pour évaluer la qualité. Reconnaît le niveau minimum de désagrégation/normalisation nécessaire pour une utilisation et une publication courantes. Peut identifier de manière cohérente les erreurs techniques et la plupart des erreurs de cohérence dans un jeu de données.

Utilise une approche systématique de l’analyse des jeux de données couvrant tous les principaux domaines de données. Peut identifier de manière cohérente les erreurs techniques et de cohérence dans un jeu de données. Peut utiliser d’autres sources de données (par exemple des métadonnées ou d’autres jeux de données) pour identifier ou déduire des erreurs de cohérence dans un jeu de données.

B. Capacité à effectuer la correction du format des données.

Ne peut apporter des corrections que manuellement dans les tableaux. Montre des connaissances génériques sur l’utilisation des types de format dans les données numériques (par exemple, dates, chaînes, nombres)

Peut identifier au moins un outil spécifique pour corriger automatiquement les erreurs de format, mais ne peut l’utiliser que dans des cas spécifiques. Sinon, utilise des mécanismes simples (par exemple, «rechercher et remplacer») pour résoudre les problèmes.

Peut utiliser au moins un outil pour corriger automatiquement les erreurs de format.

Peut utiliser les fonctionnalités avancées de plusieurs outils pour corriger les erreurs de format.

C. Capacité à effectuer des corrections de données nomenclaturales.

Ne peut apporter des corrections que manuellement dans les tableaux. Utilise uniquement les connaissances personnelles des groupes taxonomiques connus.

Peut identifier au moins un outil spécifique pour corriger automatiquement les erreurs de nomenclature, mais ne peut l’utiliser que dans des cas spécifiques. Sinon, utilise des mécanismes simples (par exemple, «rechercher et remplacer») pour résoudre les problèmes.

Peut utiliser au moins un outil pour corriger automatiquement les erreurs de nomenclature. Peut trouver et utiliser des informations nomenclaturales de référence appropriées pour les groupes taxonomiques avec lesquels il travaille habituellement.

Peut utiliser plusieurs outils pour corriger les erreurs de nomenclature. Peut trouver et utiliser des informations nomenclaturales de référence appropriées pour des groupes taxonomiques en dehors de ses domaines d’expertise.

D. Capacité à effectuer la correction des données géographiques.

Ne peut apporter des corrections que manuellement dans les tableaux. N’utilise que la connaissance personnelle des zones géographiques connues.

Peut identifier au moins un outil spécifique pour cartographier et/ou corriger automatiquement les erreurs dans les informations géographiques, mais ne peut l’utiliser que dans des cas spécifiques. Sinon, utilise des mécanismes simples (par exemple, «rechercher et remplacer») pour résoudre les problèmes.

Peut utiliser au moins un outil pour cartographier et/ou corriger automatiquement les erreurs dans les informations géographiques. Peut trouver et utiliser des informations géographiques de référence appropriées dans un format adapté aux zones avec lesquelles il travaille habituellement.

Peut utiliser plusieurs outils pour cartographier et/ou corriger automatiquement les erreurs dans les informations géographiques. Peut trouver et utiliser des informations géographiques de référence dans un format approprié pour des domaines en dehors de ses domaines d’expertise.

E. Capacité à utiliser des logiciels spécifiques (par exemple OpenRefine) comme outils de nettoyage des données.

Peut identifier au moins un outil de nettoyage de données. Peut identifier les principales fonctionnalités d’un outil de nettoyage de données (par exemple OpenRefine).

Peut identifier plusieurs outils de nettoyage de données. Peut utiliser une ou quelques-unes des fonctionnalités de base d’un logiciel de nettoyage de données pour nettoyer un ensemble de données (par exemple, créer un projet OpenRefine, utiliser la facette, le filtrage, le regroupement ou la réconciliation).

Peut utiliser toutes les fonctionnalités de base d’un logiciel de nettoyage de données pour nettoyer un ensemble de données (par exemple dans OpenRefine: facettage, filtrage, regroupement, réconciliation).

Peut utiliser les fonctionnalités avancées d’un ou plusieurs logiciels de nettoyage de données pour nettoyer les ensembles de données (par exemple dans OpenRefine: utiliser l’API, les expressions régulières, Langue d’Expression de Google Refine).

F. Capacité à documenter les procédures de transformation des données.

Décrit rarement les modifications apportées lors de la conservation, du formatage ou de la transformation des données.

Décrit les modifications effectuées la plupart du temps. Ne décrit pas les changements de manière cohérente ou complète (par exemple, décrit le changement, mais pas l’auteur).

Se souvient toujours de décrire les modifications apportées. Décrit toujours les modifications de manière cohérente, de sorte que toutes les modifications du même type puissent être facilement identifiées.

Peut décrire avec précision et cohérence les modifications apportées de manière répétable.