Exercício 3

Gestão de dados

Os dados foram agora compilados num formato de folha de cálculo pelos voluntários da Sociedade Ornitológica de Copenhaga. Assumindo o papel do Curador Ornitológico no Departamento de Aves, foi-lhe atribuída a responsabilidade dos problemas de qualidade dos dados no conjunto de dados.

Através da georreferenciação retrospectiva, as coordenadas foram adicionadas ao conjunto de dados juntamente com a localidade, mas nenhuma outra geografia ao nível superior. Uma vez que todas as observações foram feitas na Dinamarca, o continente e o país podem facilmente ser acrescentados. Além disso, somente o nome científico foi fornecido. Os níveis superiores da taxonomia podem ser obtidos usando software como o OpenRefine. Também está consciente de que existem erros tipográficos que foram cometidos pelos digitalizadores.

  1. Link de download UC3-DL-3-ForCleaning.zip. (45 KB)

  2. Identificar e corrigir quaisquer anos inválidos.

  3. Verificar e corrigir a taxonomia.

  4. Verificar se as coordenadas estão corretas para as duas localizações fornecidas. Corrija as que não estão. As coordenadas devem estar no formato decimal.

  5. Adicione quaisquer dados para elementos ausentes que possam ser derivados usando os dados disponíveis

  6. Lembre-se de manter as informações originais fornecidas e documentar suas alterações e assunções como parte dos registos individuais e metadados.

  7. Use a tabela para fornecer as suas respostas e enviar a folha de cálculo.

o conjunto de dados deve conter apenas os anos no intervalo 1883-1939