Filtres et problèmes géospatiaux
Les données peuvent être filtrées spatialement dans une recherche d’occurrences de l’une des 3 façons suivantes:
-
Pays ou zone/Continent - les données sont filtrées par pays et incluront des données dans la Zone Economique Exclusive (EEZ)
-
Zone administrative - ce filtre utilise la base de données GADM https://gadm.org/data. tml des zones administratives de tous les pays du monde pour permettre au GBIF de supprimer les problèmes géospatiaux communs par défaut si vous choisissez d’avoir des données avec une localisation.
-
Localisation - ce filtre vous permet de filtrer les données avec des coordonnées et/ou de dessiner vos propres polygones ou d’utiliser un fichier GeoJSON pour délimiter votre propre buffer. Si vous filtrez pour ces données avec des coordonnées, un certain nombre de problèmes géospatiaux associés à la publication des données seront éliminés. Parmi lesquels:
-
Zéro Coordonnées - Les coordonnées sont exactement (0,0) ou ce qui est parfois appelé "l’île nulle". La coordonnée zéro est un problème géospatiale très courant. Le GBIF supprime (0,0) lorsque 'hasgeospatialissue' est paramétré sur FALSE.
-
Inadéquation des coordonnées du pays - Les éditeurs de données fourniront souvent au GBIF un code de pays (US,TW,SE,JP…). Le GBIF utilise le système de codage ISO 3166-1 alpha-2 à deux lettres - https://fr.wikipedia.org/wiki/ISO_3166-1_alpha-2. Lorsqu’un point ne fait pas partie du polygone ou de la ZEE, mais qu’il indique se situer dans le pays, il est signalé comme ayant «country coordinate mis-match» et sera supprimé si les données sont filtrées pour leur localisation.
-
Coordonnée invalide - Si le GBIF est incapable d’interpréter les coordonnées.
-
Coordonnée invalide - Les coordonnées sont en dehors de l’intervalle pour les valeurs possibles de lat/lon décimales -90,90), (-180,180.
-
Les centroïdes des pays
Les centroïdes de pays sont ceux pour lesquels l’observation est épinglée au centre du pays à la place du lieu où le taxon a été observé ou enregistré. Les centroïdes de pays sont généralement des enregistrements auxquels on a attribué rétrospectivement une valeur lat-long basée sur une description textuelle de l’emplacement de l’enregistrement original. Les logiciels de géocodage utilisent des répertoires géographiques, des dictionnaires ou des annuaires utilisés en conjonction avec une carte ou un atlas, pour attribuer des coordonnées aux noms de lieux. Ainsi, si la notice indique simplement "Brésil", certains éditeurs placeront la notice au centre du Brésil. De même, si la notice indique simplement "Texas" ou "Paris", elle sera placée au centre de ces régions. Il s’agit d’une caractéristique presque exclusive aux données de musée (PRESERVED_SPECIMEN), mais cela peut également se produire avec d’autres types d’enregistrements.
L’identification des données dérivées de centroïdes de pays n’est pas possible actuellement avec les filtres GBIF, cependant, le programme R CoordinateCleaner peut être utilisé pour identifier et filtrer les centroïdes de pays.
Points le long de l’équateur ou du premier méridien
Certains éditeurs considèrent que zéro et NULL sont équivalents ainsi les champs de latitude et de longitude vides pour un enregistrement reçoivent une valeur zéro. En conséquence, les records finissent par être tracés le long de l’équateur et des premières lignes méridiennes.
Localisation incertaine
Souvent, vous voudrez être sûr que les coordonnées donnent un certain emplacement et ne sont pas réellement à des milliers de kilomètres de l’endroit où l’organisme a été observé ou collecté. Il existe deux champs - coordinate precision et coordinateUncertaintyInMeters - dans Darwin Core que vous obtenez avec un téléchargement CSV SIMPLE. Vous pouvez les utiliser pour filtrer par "incertitude". Cependant, ces champs ne sont pas très souvent utilisés par les éditeurs qui estiment que leurs enregistrements sont assez certains (à partir d’un GPS) et nous recommandons de ne pas écarter les valeurs manquantes.
Il existe également quelques valeurs "fausses" pour l’incertitude des coordonnées que vous devez connaître. Ces valeurs sont des erreurs produites par les logiciels de géocodage et ne représentent pas de véritables valeurs d’incertitude. Ces "fausses" valeurs sont 301, 3036, 999 et 9999. Dans le cas de la valeur 301, l’incertitude est souvent beaucoup plus grande que 301 et représente en fait un centroïde de pays.