Filtros e Incidencias Geoespaciales

Los datos pueden ser filtrados espacialmente en una búsqueda por registros de presencia en una de las siguientes 3 maneras:

  • País o área/Continente - los datos son filtrados por país e incluyen datos de la Zona Económica Exclusiva (EEZ, por sus siglas en inglés)

  • Área administrativa - este filtro utiliza la base de datos GADM https://gadm.org/data.html de áreas administrativas para todos los países del mundo permitiendo a GBIF eliminar incidencias geoespaciales comunes por defecto si se elige obtener datos con una localización.

  • Localización - este filtro permite el filtrado de datos con coordenadas y/o dibujar filtros con forma de polígonos o utilizar un archivo GeoJSON para delimitar el filtro de forma. Si se filtran esos datos con coordenadas, se eliminará un buen número de incidencias geoespaciales asociadas con el flujo de publicación de datos. Éstas son:

    • Coordinadas Cero - Las coordenadas son exactamente (0,0) o lo que algunas veces se conoce como "isla nula". Las coordenadas cero-cero es una incidencia geoespacial muy común. GBIF elimina (0,0) cuando hasgeospatialissue es marcado como FALSO.

    • Coordenadas incorrectas de país - Los publicadores de datos a menudo incluyen en GBIF un código de país (US, TW, SE, JP,…​). GBIF utiliza el sistema de codificación de dos letras ISO 3166-1 alpha-2 https://en.wikipedia.org/wiki/ISO_3166-1_alpha-2. Cuando un punto no cae en el polígono de un país o de la EEZ pero indica que debería caer en el país, éste será marcado como "coordenadas incorrectas de país" y será eliminado si los datos son filtrados por localizaciones.

    • Coordenadas inválidas - Si GBIF es incapaz de interpretar las coordenadas, ej.: las coordenadas.

    • Coordenadas inválidas - Las coordenadas se ubican fuera del rango decimal de valores de latitud/longitud -90,90), (-180,180.

Centroides de país

Los centroides de país hacen referencia al lugar donde la observación se fija en el centro del país en lugar de donde fue observado o colectado el taxón. Los centroides de país normalmente son registros a los que se les otorga un valor de latitud-longitud basado en una descripción textual sobre dónde se localizó el registro original. Los programas de geocodificación utilizan índices de toponimios (nomenclátores), diccionarios geográficos o directorios en conjunto con un mapa o atlas para atribuir coordenadas a los nombres de los lugares. Así pues, si el registro simplemente dice "Brasil", algunos publicadores colocarán el registro en el centro de Brasil. De manera similar, si el registro dice "Texas" o "París", el registro irá en el centro de esas regiones. Esta es una característica casi exclusiva de datos de museo (PRESERVED_SPECIMEN) pero también puede darse con otro tipo de registros.

Actualmente, la identificación de los centroides de país no es posible mediante el uso de los filtros de GBIF, sin embargo, el paquete R CoordinateCleaner se puede utilizar para identificar y filtrar por centroides de país.

Puntos a lo largo del ecuador o meridiano principal

Algunos publicadores consideran que cero y NULL son equivalentes para que los campos vacíos de latitud y longitud de un registro tengan un valor cero. Como resultado, los registros terminan siendo trazados a lo largo del ecuador y las líneas meridianas principales.

Localización incierta

A menudo, querremos estar seguros de que las coordenadas hacen referencia a un lugar determinado y no que éstas están en realidad a miles de kilómetros de donde se observó o colectó el organismo. Hay dos campos - precisión de coordenadas y coordinateUncertainyInMeters - en Darwin Core que obtienes descargando un CSV SIMPLE y que puedes usar para filtrar por “incertidumbre”. Sin embargo, estos campos no son muy utilizados por los publicadores ya que consideran que sus registros son bastante precisos (de un GPS) y, por tanto, recomendamos no eliminar del filtrado los valores faltantes.

También hay algunos valores “falsos” de incertidumbre de coordenadas que deben tenerse en cuenta. Estos valores son errores generados por los programas de geocodificación y no representan valores reales de incertidumbre. Estos valores "falsos" son 301, 3036, 999 y 9999. En el caso del valor 301, la incertidumbre es a menudo muchísimo mayor que 301 y en realidad representa un centroide de país.