Exercício 3
Gestão de dados
Os dados foram agora compilados num formato de folha de cálculo pelos voluntários da Sociedade Ornitológica de Copenhaga. Assumindo o papel do Curador Ornitológico no Departamento de Aves, foi-lhe atribuída a responsabilidade dos problemas de qualidade dos dados no conjunto de dados.
Através da georreferenciação retrospectiva, as coordenadas foram adicionadas ao conjunto de dados juntamente com a localidade, mas nenhuma outra geografia ao nível superior. Uma vez que todas as observações foram feitas na Dinamarca, o continente e o país podem facilmente ser acrescentados. Além disso, somente o nome científico foi fornecido. Os níveis superiores da taxonomia podem ser obtidos usando software como o OpenRefine. Também está consciente de que existem erros tipográficos que foram cometidos pelos digitalizadores.
-
Link de download UC3-DL-3-ForCleaning.zip. (45 KB)
-
Identificar e corrigir quaisquer anos inválidos.
-
Verificar e corrigir a taxonomia.
-
Verificar se as coordenadas estão corretas para as duas localizações fornecidas. Corrija as que não estão. As coordenadas devem estar no formato decimal.
-
Adicione quaisquer dados para elementos ausentes que possam ser derivados usando os dados disponíveis
-
Lembre-se de manter as informações originais fornecidas e documentar suas alterações e assunções como parte dos registos individuais e metadados.
-
Use a tabela para fornecer as suas respostas e enviar a folha de cálculo.
o conjunto de dados deve conter apenas os anos no intervalo 1883-1939 |