Préfiguration d'un service de fourniture de corpus numériques à destination de la recherche

Les services BnF et leurs rôles
Les acteurs BnF et leurs rôles
Les groupements

Description

Aujourd’hui, si une bibliothèque veut « assurer l'accès du plus grand nombre aux collections » ainsi que le prévoient les missions statutaires de la BnF, elle doit offrir plus qu’un simple accès aux contenus numérisés et océrisés : elle doit permettre aux chercheurs d’utiliser les outils d'analyse qui permettent d’aller au-delà de ce que l’œil humain peut lire, pour établir de nouvelles connaissances. La fouille de textes et de données (ou TDM pour text & data mining) offre justement l'opportunité de voir émerger de nouvelles pistes de recherche : il ne s'agit plus de consulter un document pour son seul contenu, mais d'interroger la place qu’il occupe dans un corpus, questionner ses métadonnées, ses occurrences internes et externes.

A l’heure du « big data », de nouveaux cas d’utilisation émergent dans le monde de la recherche et plus spécifiquement des humanités numériques. Forte de ses premières expériences et riche de ses collections numériques, mais aussi des métadonnées qu’elle collecte et qu’elle crée dans le cadre de son activité, la BnF envisage de mobiliser ces technologies au service de sa politique de développement des publics en imaginant un service de fourniture de corpus permettant la fouille de textes et de données à destination de la recherche.

L’objectif du présent projet est de définir le cadre d’une expérimentation multiple et transverse, portant sur différents types de corpus et mettant en œuvre des boucles d’itérations avec des chercheurs, qui débouchera à terme sur la mise en place d’un service opérationnel.