Exercice 3

Gestion des données

Les données ont maintenant été compilées dans un format de feuille de calcul par les bénévoles de la Société ornithologique de Copenhague. En tant que conservateur de la collection ornithologique au département des oiseaux, vous êtes responsable de la qualité des données du jeu de données.

Grâce au géoréférencement rétrospectif, des coordonnées ont été ajoutées au jeu de données ainsi que la localité, mais aucune autre information géographique à une échelle supérieure. Étant donné que toutes les observations ont été faites au Danemark, le continent et le pays peuvent facilement être ajoutés. De plus, seul le nom scientifique a été fourni. Une taxonomie supérieure peut être dérivée en utilisant des outils logiciels tels qu’OpenRefine. Vous savez aussi qu’il y a des erreurs typographiques qui ont été faites par les numériseurs.

  1. Télécharger UC3-DL-3-ForCleaning.zip. (45 ko)

  2. Identifier et corriger toutes les années non valides.

  3. Vérifier et corriger la taxonomie.

  4. Vérifier que les coordonnées sont correctes pour les deux localités données. Corrigez celles qui ne le sont pas. Les coordonnées doivent être au format décimal.

  5. Ajouter des données pour les éléments manquants qui peuvent être dérivés en utilisant les données disponibles

  6. N’oubliez pas de conserver les informations originales fournies et de documenter vos modifications et assomptions au niveau des enregistrements individuels et des métadonnées.

  7. Utilisez la feuille d’exercice pour fournir vos réponses et soumettre la feuille de calcul.

Le jeu de données ne doit contenir que les années 1883-1939