Ejercicio 3

Gestión de datos

Los voluntarios de la Sociedad Ornitológica de Copenhague han recopilado los datos en un formato de hoja de cálculo. Al asumir el rol de curador de ornitología en el departamento de aves, se le ha asignado la responsabilidad de los problemas relativos a la calidad de los datos.

A través de la georreferenciación retrospectiva, se han agregado coordenadas al conjunto de datos junto con la localidad, pero no otra geografía superior. Dado que todas las observaciones se realizaron en Dinamarca, el continente y el país se pueden agregar fácilmente. Además, solo se proporcionó el nombre científico. Se puede obtener una taxonomía más alta utilizando herramientas de software como OpenRefine. Usted además es consciente de que hay errores tipográficos cometidos por los digitalizadores.

  1. Descargue UC3-DL-3-ForCleaning.zip. (45 KB)

  2. Identifique y corrija cualquier año inválido.

  3. Verifique y corrija la taxonomía.

  4. Verifique que las coordenadas son correctas para las dos localidades dadas. Corrija las que no lo sean. Las coordenadas deben estar en formato decimal.

  5. Agregue cualquier dato de los elementos faltantes que puedan derivarse utilizando los datos disponibles

  6. Recuerde conservar la información original proporcionada y documentar sus cambios y suposiciones como parte de los registros individuales y los metadatos.

  7. Use the exercise sheet to provide your answers and submit the cleaned text file extracted from the step 1.

el conjunto de datos debe contener sólo los años 1883-1939