Cenário

Projeto de Mobilização de Dados a partir da Literatura “Aves caídas nos Faróis Dinamarqueses, 1883–1939”

use case 3 scanner
Scanner de alta resolução para o projeto de digitalização de livros de Heiko Hornig (licenciado sob CC BY-SA 2.5)

Esta narrativa foi desenvolvida como base para os exercícios práticos no curso de mobilização de dados sobre biodiversidade, e o conceito e conteúdo do exercício foi desenvolvido por Alberto Gonzaz-Talavaėn, Andrea Hahn, Laura Russell e Sharon Grant. O exercício baseia-se numa adaptação anterior feita por Alberto González-Talaván, Danny Vélez, Larissa Smirnova, Laura Russell, Mélianie Raymond e Nicolas Noé.

Trata-se de um cenário fictício baseado num projecto real e num conjunto de dados e destina-se apenas a fins instrutivos. projeto original e dataset original são atribuídos ao nó dinamarquês GBIF, DanBIF.

Descrição

O Museu da História Natural da Dinamarca (NHM-DK) é um centro de investigação associado à Universidade de Copenhaga. A sua biblioteca é um membro da associação de bibliotecas nacionais que recebeu recentemente financiamento estatal para disponibilizar online os recursos mantidos pelos seus membros. O NHM-DK gostaria de começar a digitalização dos cadernos de campo, publicações em revistas científicas e livros detidos na sua biblioteca, alguns dos quais têm um valor histórico significativo.

Após uma breve consulta com os seus parceiros regulares, a NHM-DK recebeu uma sugestão do chefe do gabinete de gestão do Parque Nacional de Nordjylland. Estes gostariam que o conteúdo de uma literatura clássica fosse digitalizado para um projecto em execução: "Aves nos Faróis Dinamarquesa, 1883-1939" (Em dinamarquês, “Fuglene ved de danske Fyr, 1883–1939”). Querem usar quaisquer dados de ocorrência registrados nesses livros de dois faróis (Lodbjerg Fyr e Hanstholm Fyr) para um projeto de uma exposição no local.

O NHM-DK iniciou discussões com o seu nó nacional GBIF, DanBIF, sobre a mobilização das informações contidas nestes volumes, ou seja, preservar seu conteúdo para o futuro e proporcionar acesso online para todos. Com a participação do DanBIF, existe a intenção de publicar e registar os dados extraídos com o GBIF. Uma vez que o GBIF requer que uma licença seja aplicada com todos os dados publicados. o museu decidiu publicar os dados com uma licença Creative Commons que permite o uso de dados com atribuição (CC-BY).

Os serviços de TI necessários são fornecidos pela Unidade Tecnológica da Universidade de Copenhaga, assim como por todos os projectos digitais de museus.

The NHM-DK deputy director, who is coordinating this piece of work has developed a general outline for the work:

  1. O museu executará a digitalização da literatura usando dois funcionários da biblioteca treinados no uso do scanner de bibliotecas para digitalizar volumes delicados. Eles também extrairão o texto com software de digitalização através de OCR (Reconhecimento de Caracteres).

  2. Três voluntários da Sociedade Ornitológica de Copenhaga (COS) que colaboram regularmente com o museu e estão familiarizados com as aves da região foram associados para ajudar e completarão a transferência de dados dos PDFs digitalizados para formato de folha de cálculo. Eles terão de ir ao museu e usar os computadores disponíveis na biblioteca para ter acesso aos arquivos armazenados na intranet do museu (rede privada).

  3. The Ornithology Curator in the NHM-DK Bird Department will lead the team responsible for taxonomic checking, data curation, cleaning, format and transformation, and will oversee the entry of metadata for the published dataset. The team includes a collaborating researcher from Sweden, and two postdoctoral students. They have been selected for this task because they are used to working with digital biodiversity data. They will all use their own work computers.

  4. O Coodenador do Nó DanBIF garantirá que a instituição está adequadamente registada no GBIF como um publicador de dados e que o director adjunto e o curador da ornitologia têm credenciais e acesso adequados à instância do IPT do DanBIF para carregar e publicar os dados.

Colheita de dados originais

No período de 1883-1939, estiveram em funcionamento na Dinamarca 45 faróis e faróis flutuantes. Estes faróis foram utilizados por várias espécies de aves durante as noites do período de migração de aves entre os anos de 1886 e 1939. A presença e as actividades dessas aves foram registadas, especialmente pelos responsáveis desses faróis que recolheram também espécimes enviados para o museu em Copenhaga. Estes pássaros foram cuidadosamente preservados e catalogados por gestores de colecção no museu e ainda hoje é possível encontrar ali espécimes. Foram também documentadas observações sobre as condições meteorológicas durante a noite em que as aves eram observadas pelos faroleiros.

Descrição dos dados analógicos

Este é um exemplo da descrição de uma série de observações de espécies de um dos livros (em alemão, exceto o nome comum para a espécie que é fornecido em Danish).

use case 3 analogue

Descrição de dados digitalizados e traduzidos

Este é um exemplo da saída digitalizada e traduzida do exemplo analógico acima.

use case 3 scanned

Descrição dos dados digitais

Estudando o extrato do livro, os voluntários da Sociedade de Ornitologia de Copenhaga sugerem extrair os seguintes dados do texto digitalizado e traduzido:

  • O nome científico como aparece no livro

  • Nome(s) comum(ns) em dinamarquês como aparece no livro

  • Localidade

  • Ano/mês/dia

  • Número de indivíduos observados

  • Sexo

  • Estágio de vida

  • Observações

  • URL da página de livro digitalizado em que a ocorrência é fornecida