Escenario

Proyecto de movilización de datos de la literatura "Aves caídas en los faros daneses, 1883–1939"

use case 3 scanner
Escáner de alta resolución para el proyecto de digitalización de libros de Heiko Hornig (licenciado bajo CC BY-SA 2.5)

Esta narrativa fue desarrollada como base para ejercicios prácticos del curso de movilización de datos de biodiversidad y el concepto y contenido del ejercicio fue desarrollado por Alberto González-Talaván, Andrea Hahn, Laura Russell y Sharon Grant. Se basa en una adaptación previa de Alberto González-Talaván, Danny Vélez, Larissa Smirnova, Laura Russell, Mélianie Raymond y Nicolas Noé.

Es un escenario ficticio basado en un proyecto y en un conjunto de datos reales y está destinado a fines educativos únicamente. Se atribuyen el proyecto original y el conjunto de datos original al nodo GBIF danés, DanBIF.

Descripción

El Museo de Historia Natural de Dinamarca (NHM-DK) es un centro de investigación asociado con la Universidad de Copenhague. Su biblioteca es miembro de la asociación nacional de bibliotecas que recientemente recibió fondos estatales para poner en línea los recursos que poseen sus miembros. El NHM-DK desea comenzar a digitalizar los cuadernos de campo, las publicaciones de revistas y los libros que se encuentran en su biblioteca, algunos de los cuales tienen un valor histórico significativo.

Después de una breve consulta con sus socios habituales, NHM-DK recibió una sugerencia del director de la oficina de gestión del Parque Nacional Nordjylland. Les gustaría que se digitalizara el contenido de una recopilación de literatura clásica particular para un proyecto que están ejecutando: "Aves en los faros daneses, 1883-1939" (en danés, "Fuglene ved de danske Fyr, 1883-1939"). Quieren utilizar cualquier dato de registros biológicos consignado en los libros de dos faros (Lodbjerg Fyr y Hanstholm Fyr) para un proyecto de exhibición en el lugar.

El NHM-DK ha iniciado conversaciones con el nodo nacional de GBIF, DanBIF, sobre la movilización de la información contenida en estos volúmenes, es decir, para preservar sus contenidos para el futuro y proporcionar acceso en línea para todos. Con la participación de DanBIF, existe la intención de publicar y registrar los datos extraídos resultantes en GBIF. Como GBIF requiere que se aplique una licencia con todos los datos publicados, el museo ha decidido publicar los datos con una licencia Creative Commons que permite el uso de datos con atribución (CC-BY).

Los servicios informáticos necesarios son proporcionados por la Unidad de Tecnología de la Universidad de Copenhagen, como para todos los proyectos digitales de los museos.

El subdirector del HHM-DK, que está coordinando este trabajo, ha elaborado un esquema general del mismo:

  1. El museo llevará a cabo la digitalización de la literatura mediante dos miembros del personal de la biblioteca, capacitados en el uso del escáner de la biblioteca, para escanear volúmenes delicados. También extraerán el texto de los escaneos mediante un software de reconocimiento óptico de caracteres (OCR).

  2. Tres voluntarios de la Sociedad Ornitológica de Copenhague (COS), que colaboran regularmente con el museo y están familiarizados con las aves de la región, han sido reclutados para ayudar y completarán la transferencia de datos de los PDF escaneados al formato de hoja de cálculo. Deberán ir al museo y utilizar las computadoras disponibles en la biblioteca para acceder a los archivos almacenados en la intranet del museo (red privada).

  3. El curador de ornitología del Departamento de Aves del NHM-DK dirigirá el equipo responsable de la verificación taxonómica, la curación, la limpieza, el formato y la transformación de los datos, y supervisará la introducción de metadatos para el conjunto de datos publicado. El equipo incluye un investigador colaborador de Suecia y dos estudiantes posdoctorales. Han sido seleccionados para esta tarea porque están acostumbrados a trabajar con datos sobre biodiversidad. Todos ellos utilizarán sus propios computadores de trabajo.

  4. El administrador de nodo de DanBIF se asegurará de que la institución esté debidamente registrada en GBIF como publicador de datos, y de que el director adjunto y el curador de ornitología tengan las credenciales adecuadas y el acceso a la instancia de IPT de DanBIF para cargar y publicar los datos.

Recopilación de datos originales

En el período 1883-1939, había 45 faros y buques faro en funcionamiento en Dinamarca. Estos faros fueron utilizados por varias especies de aves durante las noches del período de migración de aves desde los años 1886 hasta 1939. La presencia y las actividades de estas aves fueron registradas, especialmente por los guardianes de estos faros que también colectaban especímenes que se enviaban al museo de Copenhagen. Estas aves fueron cuidadosamente conservadas y catalogadas por los encargados de la colección en el museo y los especímenes aún se pueden encontrar allí hoy en día. También se documentaron las observaciones de las condiciones meteorológicas durante las noches en las que los cuidadores observaron las aves.

Descripción de datos análogos

Este es un ejemplo de la descripción de una serie de observaciones de especies de uno de los libros (en alemán, excepto el nombre común de la especie que se proporciona en danés).

use case 3 analogue

Descripción de datos escaneados y traducidos

Este es un ejemplo de la salida escaneada y traducida del ejemplo análogo anterior.

use case 3 scanned

Descripción de datos digitales

Al estudiar el extracto del libro, los voluntarios de la Sociedad de Ornitología de Copenhague sugieren extraer los siguientes datos del texto escaneado y traducido:

  • Nombre científico que aparece en el libro

  • Nombre(s) común(es) en danés que aparece(n) en el libro

  • Localidad

  • Año/mes/día

  • Número observado de individuos

  • Sexo

  • Etapa de la vida

  • Comentarios

  • URL de la página del libro digitalizado en la que se proporciona el registro biológico