Soluções de revisão da gestão de dados
Por que é melhor limpar os seus dados?
-
para torná-los o mais possível adequados ao uso
-
para atingir as suas metas de qualidade de dados
Deve sempre procurar gerir e publicar dados com a maior qualidade possível. Isto irá melhorar o seu trabalho diário (é mais fácil de trabalhar com dados organizados e limpos), assim como o trabalho de potenciais reutilizadores dos seus dados, que precisam de compreendê-los e confiar na sua fonte antes de usá-los.
Como deve organizar o seu fluxo de trabalho de limpeza de dados?
-
peça aos seus colegas o conhecimento especializado
-
trabalhe ao nível institucional para harmonizar fluxos de trabalho de qualidade de dados
Ninguém sabe tudo sobre os dados da biodiversidade; deve procurar ajuda e aconselhamento com os seus colegas ou outras pessoas conhecidas. e certifique-se de aplicar as boas práticas recomendadas pela sua instituição enquanto limpa os seus dados.
Qual é o melhor:
-
prevenir a ocorrência de erros
-
corrija erros assim que os encontrar na sua base de dados ou tabela
A melhor maneira de evitar a propagação de erros nos seus dados é evitá-los no início do processo de colheita/registo de dados.
É claro que os erros são inevitáveis, portanto também deve limpá-los assim que os encontrar, e documentar o processo de limpeza.
Se não tem tempo ou recursos para limpar os seus dados corretamente, é melhor esperar conseguir fazê-lo em vez de publicar dados errados que podem confundir as pessoas.
De quem é a responsabilidade da qualidade dos dados?
-
De todos os participantes na gestão dos dados
Cada pessoa envolvida no seu fluxo de trabalho de gestão de dados é pelo menos parcialmente responsável pela sua qualidade, desde os técnicos de campo até ao(s) gerente(s) da base de dados.
As pessoas que mais tarde possam utilizar os seus dados, podem informá-lo de qualquer erro que permaneca nos seus dados e devem utilizá-los de forma responsável na sua própria investigação, mas a qualidade inicial dos dados não é responsabilidade delas.
O GBIF pode realizar verificações automáticas nos seus dados (por exemplo, detecção de valores ausentes, outliers geográficos, nomes científicos desconhecidos), mas não deve ser responsabilizados pelos erros que ocorreram anteriormente no processo de gestão de dados.
Quais as ferramentas que podem ser usadas para limpar os seus dados?
-
Excel e outras ferramentas de gestão de folhas de cálculo
-
OpenRefine
-
O seu software de base de dados
-
Ferramentas on-line como o Scientific Names Resolver ou Google Maps
Todos os tipos de ferramentas podem ser usadas para limpar os seus dados, mas deve identificar quais responderão às suas necessidades em termos de resolução taxonómica, georeferenciação, exclusão de duplicados e assim por diante. Pode encontrar Ferramentas úteis listados na seção de gestão de dados.