Datapoc 2.0 : Lier les données pour les consolider et ouvrir de nouvelles perspectives de recherche sur l’histoire de la biodiversité

Budget
100 000 euros

Les entités participant au financement
Les partenaires et leurs rôles

Description

La preuve de concept datapoc.mnhn.fr, lauréate de l’AAP 2018, utilise les technologies du web sémantique pour explorer les possibilités d’alignement, de liage et de publication de données utiles à la recherche taxonomique (métadonnées, numérisations...) issues de plusieurs réservoirs de données du Muséum associées à un corpus d’environ 500 noms de savants et collecteurs naturalistes. Le prototype https://datapoc.mnhn.fr permet d’évaluer la pertinence d’un nouveau mode de navigation dans ces données liées. Il offre aussi des possibilités de réutilisation, notamment aux fins d’enrichissement d’agrégateurs et de référentiels. Les premiers résultats incitent à poursuivre le projet dans trois directions :

1. Dans la perspective d’un passage à l’échelle, l’extension du volume de données : inventaires d’archives, données d’observation, publications déposées dans HAL... Le corpus sera enrichi selon les priorités des chercheurs embarqués dans le projet.
2. Les traitements algorithmiques déployés ont révélé des problèmes de qualité et de structuration dans les données sources. Ce constat motive l’intention de doter le service d’un outil collaboratif de repérage et de correction des anomalies par les chercheurs et les collecteurs. Ces fonctionnalités seraient destinées tant aux scientifiques et gestionnaires du MNHN qu’aux amateurs, dans la dynamique des sciences participatives.
3. Il s’agira enfin de tester plus avant les mécanismes de réutilisation et d’enrichissement croisé des données en coopération avec des partenaires extérieurs : Fichier national d’entités (Abes/BnF), bibliothèque numérique BHL (Biodiversity Heritage Library), infrastructure européenne DISSCO (Distributed System of Scientific Collections).

Porteur du projet :

Muséum national d’histoire naturelle

Partenaires :

Agence bibliographique de l’Enseignement supérieur (Abes) - Bibliothèque nationale de France (BnF) - Consortium Biodiversity Heritage Library (BHL)


Documents disponibles

Contacts
Cindy Lim
Chargée de mission Datapoc 2.0
Cécile Callou
Responsable scientifique du projet
Chloé Besombes
Chef du projet Datapoc 2.0