photo

Colophon

Suggestion de citation

Figueira R, Beja P, Villaverde C, Vega M, Cezón K, Messina T, Archambeau A, Johaadien R, Endresen D & Escobar D (2020) Guidance for private companies to become data publishers through GBIF: Template document to support the internal authorization process to become a GBIF publisher. Copenhagen: GBIF Secretariat. https://doi.org/10.35035/doc-b8hq-me03

Licence

Le document Guide à destination des entreprises privées pour devenir éditeurs de données via le GBIF est sous licence Creative Commons Attribution-ShareAlike 4.0 Licence.

Contrôle du document

Version 2.0, Juin 2020

Résumé

Ce document est une contribution à projet OpenPSD: Promouvoir la publication et l’utilisation des données du secteur privé sur la biodiversité, une création commune des nœuds GBIF de Spain, Portugal, Norway, https://www. bif.org/fr/country/FR/participation[France] et Colombia et les entreprises EDP, CIBIO et Asplan Viak et cofinancé par le Secrétariat du GBIF via son Programme de soutien au renforcement des capacités.

Image de couverture

Figue marine (Carpobrotus edulis), Aljezur, Portugal. Photo 2020 sheborg via iNaturalist research-grade observations, licencié sous CC BY-NC 4.0.

1. Introduction

Les étapes pour qu’une entreprise devienne éditrice de données via le GBIF sont relativement simples. Cependant, le futur éditeur doit être conscient des responsabilités des éditeurs et utilisateurs de données GBIF, ainsi que des différents aspects liés à la préparation, la publication et au suivi des données publiées.

En fonction de la taille de l’entreprise, il se peut que le premier contact avec le GBIF soit établi par le personnel des services Environnement ou Développement Durable. Cependant, la décision de devenir éditeur sera généralement prise par un administrateur ou un directeur, qui devra être informé de ce que signifie devenir éditeur GBIF et des avantages pour l’entreprise.

Le GBIF, en collaboration avec l’IAIA (International Association for Impact Assessment), a publié un guide pour les organisations du secteur privé qui réalisent des évaluations d’impact environnemental (EIE) qui couvre la plupart des avantages et des aspects techniques de la publication des données via GBIF. Ce document est en cours de mise à jour car il lui manquait certains aspects importants tels que les coûts, l’adoption de licences et les relations avec les différentes parties impliquées dans la production de données au sein d’une organisation, qui peuvent inclure des sous-traitants.

L’objectif de ce document est de servir de cadre de référence pour établir un processus de documentation interne à présenter aux organes de décision de l’entreprise pour informer et soutenir leur décision de devenir éditeur du GBIF. À cet égard, plusieurs aspects sont abordés, tels que:

  • Qu’est-ce que le GBIF ?

  • Quels sont les avantages de publier des données via GBIF?

  • Qui publie et quelles données sont publiées via le GBIF ?

  • Quelles étapes devez-vous suivre pour devenir éditeur de données ?

  • Comment impliquer toutes les parties associées aux jeux de données dans votre publication ?

  • Quels sont les coûts associés à la publication ?

Ce cadre de référence propose qu’une preuve de concept soit élaborée en interne. Celle-ci identifiera les étapes nécessaires à la réalisation d’une publication de données, générant une appropriation interne du modèle de publication de données, qui va du traitement des données sur la biodiversité de l’entreprise, en passant par l’évaluation des ressources internes et externes qui doivent être assignées.

2. Proposal: Publication des données sur la biodiversité via le GBIF

2.1. Présentation

Il est proposé dans ce document d’impliquer entreprise en tant qu’éditeur de données de biodiversité sur la plateforme intergouvernementale GBIF—le Global Biodiversity Information Facility (Système mondial d’information sur la biodiversité).

Dans le contexte du déclin de la biodiversité mondiale, l’occurrence d’espèces et les données d’abondance sont des outils essentiels pour la planification, la mise en œuvre et le suivi des stratégies de conservation et d’utilisation durable. Cette importance est reconnue à l’échelle mondiale par le Objectifs des Nations Unies pour le développement durable, à savoir les SDG14 et le SDG15, auxquels le GBIF devient essentiel pour l’évaluation des progrès vers les objectifs. De même, Aichi Target 19 de la Convention sur la diversité biologique (CBD) utilise la publication de données sur le GBIF d’ici 2020 comme un des indicateurs pour mesurer la conformité de la cible .

De même, l’objectif 19 d’Aichi, défini par la Convention sur la Diversité Biologique (CDB), utilise la publication de données sur le GBIF comme l’un des indicateurs pour valider l’atteinte de l’objectif d’ici 2020. Aux côtés des universités, instituts de recherche et agences gouvernementales, le secteur privé peut y jouer un rôle clé, grâce aux milliers d’études d’impacts environnementaux effectuées au niveau local dans le monde entier, qui produisent chaque année des millions de données. Cependant, la participation à cet effort est encore très faible, et les données ne sont jamais, ou très rarement, mises à disposition du plus grand nombre. Dans ce domaine, entreprise pourrait prendre une position de tête au niveau national / international, en partageant ses données dans le GBIF de manière organisée et systématique.

Ainsi, nonobstant la prudence nécessaire aux aspects liés à la propriété intellectuelle et à la confidentialité, il est proposé de réaliser une preuve de concept, afin de développer et d’évaluer un modèle de publication des données de biodiversité par entreprise, qui constituera une étude de cas pour le GBIF et entreprise. Cet exercice devrait avoir plusieurs avantages pour entreprise : participer à consolider sa réputation nationale / internationale en tant qu’entreprise pionnière dans le domaine du développement durable, et renforcer la disponibilité des données, leur intégration et les processus d’organisation qui pourraient être réutilisés dans d’autres contextes.

2.2. Qu’est-ce que le GBIF ?

Le Système Mondial d’Information sur la Biodiversité est une organisation intergouvernementale créée en 2001 afin de faciliter le partage et l’accès libre et ouvert aux données de biodiversité. A l’heure actuelle, 59 pays ont signé le Memorandum of Understanding du GBIF. Le GBIF fournit un point d’accès unique à plus d’un milliard de données de biodiversité à l’échelle de la planète, et constitue le plus grand réseau sur la biodiversité accessible via Internet. Les données accessibles via le GBIF concernent des enregistrements de plus d’1,6 million d’espèces, collectées sur plus de trois siècles d’exploration de l’Histoire Naturelle, et incluent des observations récentes des programmes de science participative, de la Recherche et des programmes de suivi automatisé. Les données téléchargées depuis le GBIF ont été utilisées en 2018 et 2019 dans plus de 1300 articles scientifiques publiés dans des revues internationales. A l’échelle mondiale, le GBIF a des accords et fournit directement des services aux initiatives décisionnaires internationales pour le suivi et la conservation de la biodiversité et de l’environnement, telles que la Convention sur la Diversité Biologique (CDB), la Plateforme intergouvernementale scientifique et politique sur la biodiversité et les services écosystémiques (IPBES) et GEO BON (Group on Earth Observation - Biodiversity Observation Network).

Paragraphe avec des informations sur le noeud national GBIF

2.3. Quels sont les avantages de la publication des données dans le réseau GBIF ?

La publication de données sur la biodiversité dans le GBIF est une initiative qui pourrait être très visible dans le monde entier, aider à consolider la réputation de la « entreprise » en tant que référence dans le domaine de la durabilité. En fait, la publication de données sur le GBIF est considérée comme très importante au sein de la CDB et a même été choisie comme l’un des indicateurs cibles d’Aichi (Target 19) de la Décennie de la biodiversité (2010-2020). Les données publiées par le GBIF contribuent également à Aichi Targets 9 (espèces envahissantes), 11 (aires protégées) et 12 (espèces menacées). De même, ces données seront pertinentes également pour l’évaluation du DDG 14 (Life below water) et du DDG 15 (Life on Land).

En contribuant à ces objectifs, entreprise améliorera également son profil environnemental et social en augmentant le retour sur investissement initialement fait pour obtenir ces données. Le GBIF est très désireux d’utiliser et de diffuser de nouvelles études de cas, et la mobilisation des données du secteur des affaires est actuellement un objectif important de l’organisation. Ce processus pourrait contribuer favorablement à la performance de l’organisation sur l’Indice de durabilité Dow Jones et à l’évaluation de l’entreprise dans le cadre des Principes de l’Équateur.

Un autre avantage de ce processus serait de poser les fondations pour améliorer le modèle de gestion des informations collectées dans le contexte des études d’impact environnementaux, ainsi que le suivi des impacts et les mesures de compensation. La collecte de ces données demande des études coûteuses, pour lesquelles la valeur ajoutée des informations collectées est souvent faible en raison de l’inefficacité de leur gestion ultérieure. Pour cette raison, les informations sont souvent perdues ou difficiles d’accès et ne contribuent donc pas au processus d’apprentissage interne ni à la réutilisation d’informations collectées dans de nouveaux projets ou à la gestion environnementale durable des infrastructures en opération.

La publication de données dans le réseau GBIF, avec l’appui d’un point nodal GBIF national, fournirait motivation et outils supplémentaires pour la gestion de ce type d’informations, ce qui serait potentiellement applicable pour le groupe entreprise aux niveaux national et international.

En résumé, d’après le rapport Digitally Transforming Environmental Assessment, la mise en ligne de données de biodiversité par des entreprises privées entraîne :

  • Réduire le coût de la recherche d’informations

  • Besoin réduit pour des enquêtes détaillées sur le terrain

  • Des informations plus complètes sur les impacts aux étapes préliminaires, pouvant réduire le recours à une étude d’impacts environnementaux (6 à 18 mois économisés)

  • Des données de suivi améliorées, réduisant le risque de suspension temporaire des opérations pour un manquement à la conformité

  • Une confiance accrue envers les entreprises soucieuses de l’environnement pour de futurs investissements et partenariats

  • Une probabilité accrue d’obtenir des marches

  • L’utilisation de données et d’outils ouverts pour prendre des décisions environnementales rendra le processus plus transparent et permettra de gagner en confiance et en fiabilité

  • La confiance accrue des investisseurs et de la communauté suscitera un intérêt grandissant pour les actions avec les secteur privé portées par les organismes publics

  • De meilleurs outils pour traiter les données facilement accessibles aideront à évaluer l’ampleur de l’impact, ainsi que la valeur, le type et le succès de toute compensation proposée

2.4. Qui publie des données dans le réseau GBIF ?

To date, GBIF includes more than 60,000 datasets on its portal published by more than 1,700 data publishing institutions. These publishers are mostly government agencies, natural history museums and herbaria, universities, research centres and non-governmental organizations of various kinds.

The almost complete absence of the business sector is noticeable, which limits access to a vast and important volume of biodiversity data collected by companies around the world. In total, private companies now publish at least 7,789,180 occurrence records, accounting for 0.3 per cent of all records published in GBIF.

Table 1 Le tableau 1 liste les principaux éditeurs de données issus du secteur privé.

Tableau 1.Private-sector companies that publish their data through GBIF (as of August 2023)

Company

Activity sector

Country

Datasets

Occurrence records

Data citations

AGBAR

Consulting

Spain

1

103,424

42

ARC - Arctic Research and Consulting DA

Consulting

Norway

1

8,914

60

Aguas de Bogotá S.A. E.S.P.

Utilities

Colombia

1

13,280

63

Akvaplan-niva

Consulting

Norway

3

594

13

Anadarko Colombia Company

Energy

Colombia

7

1,178

41

AngloGold Ashanti Colombia S.A.S

Materials

Colombia

5

87,020

113

Asplan Viak AS

Engineering

Norway

14

3,775

349

Aures Bajo

Energy

Colombia

2

368

22

Awake Travel

Consulting

Colombia

1

8,644

9

Aïgos SAS

Consulting

Colombia

3

2,404

37

Biofokus

Consulting

Norway

1

605,695

927

Biolog J.B. Jordal AS

Consulting

Norway

1

177,814

550

Biotica Consultores Ltda

Consulting

Colombia

4

1,318

143

Carbones del Cerrejón Limited

Materials

Colombia

9

197,100

178

Carsa Gold S.A.S

Mining

Colombia

1

4,159

37

Celsia Colombia S.A. E.S.P.

Energy

Colombia

5

2,290

45

Central Hidroeléctrica de Caldas S.A E.S.P

Energy

Colombia

1

1,137

23

Cerro Matoso S.A

Materials

Colombia

3

19,309

131

Chevron Australia

Energy

Australia

1

2,048

53

Compensation International Progress S.A. -Ciprogress Greenlife-

Industrials

Colombia

1

820

51

Concesión La Pintada S.A.S

Industrials

Colombia

2

0

0

Construcciones y Ambiente Conambiente S.A.S

Consulting

Colombia

3

273

43

Cunaguaro Consultores LTDA

Consulting

Colombia

1

657

34

DNV

Energy

Norway

1

2,372,473

51

EDP - Energias de Portugal

Energy

Portugal

106

1,831,557

349

ENGIE

Energy

France

5

13,888

0

Ecofact

Consulting

Norway

3

12,508

382

Econativa Consultores SpA

Consulting

Chile

1

3

7

Ecopetrol S.A.

Energy

Colombia

45

397,693

90

Empresas Públicas de Medellín E.S.P.

Energy

Colombia

39

2,151,219

113

Enel Colombia

Energy

Colombia

11

29,101

30

Equinor

Energy

Norway

1

1,017

1

Faun Naturforvaltning AS

Consulting

Norway

1

3,788

344

Federación Nacional de Cacaoteros

Agriculture

Colombia

1

17

12

Federación Nacional de Cafeteros de Colombia

Agriculture

Colombia

6

26,804

343

Grupo Energía Bogotá

Energy

Colombia

1

61,111

99

HBH Projekt spol. s r.o.,Kabátnikova 5, 602 00 Brno,ČR – organizačná zložka Slovensko

Engineering

Slovakia

2

204

4

Hatovial S.A.S

Engineering

Colombia

1

1,898

118

INERCO Consultoría Colombia

Consulting

Colombia

1

1,090

132

Isagen S.A. E.S.P.

Energy

Colombia

12

41,665

285

LafargeHolcim Spain

Mining

Spain

2

35

30

Lake Tanganyika Floating Health Clinic

Health Care

Congo, Democratic Republic of the

1

132

4

Mineros Aluvial S.A.S. BIC

Mining

Colombia

1

7,307

15

Moam Monitoreos Ambientales S.A.S

Consulting

Colombia

1

1,781

45

Monitoramento fauna e flora Mineração Vale Verde do Brasil Ltda.

Materials

Brazil

1

299

88

Multiconsult

Consulting

Norway

1

308

133

NNI Resources AS

Consulting

Norway

2

3,116

84

NaturRestaurering AS

Consulting

Norway

8

16,024

212

Nature monitoring data, Amphi Consult and Biomedia, Denmark

Consulting

Denmark

1

47,254

1

Navantia, S.A.

Industrials

Spain

6

823

18

Nocturne Environmental Surveyors Ltd

Consulting

United Kingdom of Great Britain and Northern Ireland

1

32

16

Oleoducto Bicentenario

Energy

Colombia

11

4,161

211

Parex Resources Colombia - AG Sucursal

Energy

Colombia

8

41,581

4

Pierre Fabre

Consumer Staples

France

20

4,049

112

Promigas S.A E.S.P

Energy

Colombia

12

180,848

216

Regelink Ecology & Landscape

Consulting

Netherlands

1

157,976

96

Rådgivende Biologer

Consulting

Norway

5

15,214

323

SWECO Norge AS

Engineering

Norway

1

1,139

327

Stratos Consultoría Geológica

Consulting

Colombia

2

1,084

25

TERRASOS

Consulting

Colombia

9

24,817

201

TotalEnergies

Energy

France

14

22,232

89

Veolia Colombia

Energy

Colombia

2

672

1

Table 2. Grand Totals

Datasets

Occurrence records

Data citations

418

8,719,141

7,575

2.5. Quelles données une entreprise peut-elle publier dans le GBIF ?

Les entreprises qui effectuent des études d’impacts environnementaux, du suivi d’impact et des études de mesures compensatoires, collectant ainsi des données d’occurrence ou d’abondance d’espèces, peuvent les publier dans le GBIF.

Beaucoup de ces données sont collectées dans des régions dans lesquelles les efforts de prospection sont faibles et dont la biodiversité est moins connue, ou possèdent des organismes sous-représentés, et sont donc d’un grand intérêt pour la communauté scientifique et les organisations comme la CBD, IPBES ou GEO BON.

Même les données collectées dans des régions mieux étudiées peuvent être précieuses, car elles permettent de combler les lacunes d’information et d’améliorer les suivis temporels. Ainsi, toutes les données collectées par entreprise au cours de ses opérations peuvent être publiées dans le GBIF, en prenant en compte la protection de la propriété intellectuelle et de la confidentialité (permanente ou temporaire) des informations.

Si les données comportent des informations sensibles, telles que la localisation d’espèces menacées, sensibles ou ayant une forte valeur économique, il est recommandé d’appliquer https://doi.org/10.15468/doc-5jp4-5g10 [les bonnes pratiques en floutant ces informations^].

De cette façon, les données collectées par des entreprises privées peuvent être publiées dans le GBIF au bout d’une courte période, si les aspects administratifs de la publication sont finalisés et si le format des données est adapté à la structure exigée par le GBIF (principalement le Darwin Core). Le point nodal national peut également fournir tout le support technique demandé au cours du processus de standardisation et de publication des données.

2.6. Comment une entreprise devient-elle éditeur de données dans le GBIF?

La décision de devenir éditeur de données de biodiversité dans le réseau GBIF doit être prise par les branches administratives de entreprise, Il est ensuite nécessaire de compléter quelques étapes, communes à toutes les institutions souhaitant s’enregistrer comme éditeur de données :

  • Prendre des mesures au niveau institutionnel pour s’assurer que toutes les parties impliquées dans le processus, de l’administration jusqu’aux partenaires liés à la production des données, donnent leur accord pour la publication des données selon les termes indiqués

  • Prendre connaissance et accepter le Data Publisher Agreement (la version anglaise est valide dans un cadre juridique)

  • Prendre connaissance du Data User Agreement, que les utilisateurs du GBIF doivent accepter avant d’utiliser les données

  • Soumettre la candidature de l’institution pour qu’elle soit enregistrée comme éditrice de données GBIF, et demander la validation du point nodal national. Les demandes d’enregistrement et de validation se font en ligne via ce formulaire

2.7. Implication des différentes parties dans le processus de publication

Selon l’importance des projets dans le cadre desquels les jeux de données sont produits, il est possible que les données de biodiversité de l’entreprise aient été obtenues par le biais d’autres entreprises ou organisations ayant effectué le travail de collecte. Il s’agit de la configuration la plus commune dans le cas des études d’impacts environnementaux ou des études de suivi, pour lesquelles des sociétés sous-traitantes effectuent les campagnes d’échantillonnage. L’implication dans le processus de publication des données de ces sous-traitants et techniciens de terrain, qui ont observé ou identifié les espèces, est souhaitable à chaque fois qu’elle est possible. Ces techniciens peuvent jouer un rôle important, notamment dans la vérification des données et métadonnées, et contribuer ainsi à une meilleure qualité du jeu de données. Il est également important qu’ils soient reconnus et cités pour leur travail, et associés aux enregistrements publiés. Une autre façon de les associer, ainsi que leur organisation, au jeu de données est de les identifier dans les “parties associées” lors du remplissage des métadonnées. Ils doivent être inclus en tant que co-auteurs du jeu de données et dans la citation de ce dernier.

2.8. Comment peut être développée la preuve de concept ?

La preuve de concept concernant la publication de données dans le GBIF pourrait être développée selon les étapes suivantes :

  1. Développement des processus internes de l’entreprise menant à la décision de publier des données dans le GBIF de façon expérimentale.

  2. Soumission par l’entreprise de la demande d’enregistrement en tant qu’éditeur de données.

  3. Mise en place d’une étude de cas sur l’implication de l’entreprise en tant qu’éditeur de données avec le point nodal national, les partenaires nationaux et le GBIF international, afin de donner une visibilité mondiale au processus et inciter d’autres entreprises à s’investir en tant qu’éditeurs de données.

  4. Sélection d’un premier jeu de données pour publication sur le GBIF, issu d’études effectuées par l’entreprise. Ce jeu de données doit contenir une bonne représentation de la diversité taxonomique des groupes étudiés et des formats de données, afin d’anticiper les potentiels problèmes liés à la structure et à la disponibilité de l’information.

  5. Définition du type d’informations pouvant être publiées et de toute restriction sur leur publication, par exemple la présence d’espèces sensibles, d’informations confidentielles, de données en attente de validation par des institutions gouvernementales, etc. Les données d’occurrence (observation ou collecte d’une espèce donnée à un lieu et une date données) ou d’abondance peuvent être publiées.

  6. Establishment of agreements with data producers (i.e. the institutions and staff hired by the company to collect data for the purposes of the studies) to safeguard intellectual property rights.

  7. Mise en place d’accords avec les producteurs de données (par exemple institutions et personnels embauchés par l’entreprise pour collecter des données dans le contexte d’études de terrain), afin de garantir le droit à la propriété intellectuelle. Formatage des données afin qu’elles soient publiées dans le respect du standard Darwin Core utilisé par le GBIF pour préparer les bases de données pour la publication.

  8. Sélection d’une licence Creative Commons licence à attribuer au jeu de données en cours de publication ; le choix doit s’effectuer parmi les licences CC0, CC-BY, ou CC-BY-NC5.

  9. Publier données et métadonnées associées à chaque jeu de données enregistré sur le portail GBIF. Les options de mise en ligne de données seront étudiées, et utiliseront dans tous les cas la plateforme logicielle développée par le GBIF : l’Integrated Publishing Toolkit (IPT). Les points nodaux GBIF maintiennent un IPT, qu’ils rendent accessible pour héberger les jeux de données d’éditeurs de leur pays. Il est aussi possible pour une entreprise d’installer et maintenir son propre IPT. Dans les deux cas, l’éditeur de données est toujours l’institution (entreprise), et non le point nodal, et l’institution est responsable de la gestion des données (modifications, mises à jour) de façon autonome.

  10. Suivre l’utilisation des données publiées durant une période d’un an après leur mise en ligne dans le réseau GBIF. Cela sera fait grâce aux statistiques fournies par l’éditeur de données concernant l’envoi de données. De plus, l’utilisation des données dans les publications scientifiques sera suivie grâce à l’attribution d’un Digital Object Identifier (DOI) à chaque jeu de données enregistré sur le GBIF ou téléchargé via le GBIF.

2.9. Quels sont les coûts pour entreprise ?

Mis à part le temps consacré par les équipes de entreprise à la préparation de la preuve de concept, il n’y a pas de coût s supplémentaires pour l’entreprise. Le travail nécessaire peut se faire avec l’appui du point nodal GBIF national, qui a les connaissances et l’infrastructure nécessaires pour faciliter la publication des données. Si le point nodal national met son installation IPT à disposition pour héberger et publier les données, il est recommandé d’encadrer ce service avec le Service Level Agreement entre le point nodal GBIF (fournisseur du service) et l’entreprise (utilisateur du service). Ce service n’a pas non plus de coûts associés. De plus, le point nodal GBIF peut effectuer une formation sur la mise en ligne des données dans le réseau GBIF, contribuant ainsi à renforcer les capacités de entreprise dans les domaines de la gestion des informations sur la biodiversité et de la qualité des données.

Références