Moteur de recherche sémantique de Gallica

Les services BnF et leurs rôles
Les acteurs BnF et leurs rôles
Les groupements

Description

Pilote : BnF (Sylvie FLORES, département des Systèmes d’information, direction des Services et des réseaux).

Financement : BnF sur ses ressources.
Objectif :
Doter la bibliothèque numérique Gallica d’un moteur d’indexation et de recherche sémantique pour faciliter l’accès à ces ressources. Le moteur CloudView conçu par la société Exalead a été choisi. La plate-forme de tests a été livrée le 4 mai 2011. Les fonctionnalités linguistiques suivantes sont activées à la recherche : lemmatisation (singulier/pluriel, masculin/féminin), recherche approchée par phonèmes et par distance de Levenstein. Le regroupement de résultats (« Collapsing ») permet de regrouper les documents en fonction d’une clé et de n’afficher qu’un résultat (le document le plus pertinent de l’ensemble) représentant le regroupement, de ne montrer qu’un volume issu d’un ensemble de livres, images…, de ne retrouver qu’un fascicule/périodique sur un ensemble de fascicules.

À l’été 2012, le moteur a été mis à la disposition des utilisateurs, aux fins de tests, sur le site Gallica Labs (url : <http://gallicalabs.bnf.fr/>) qui offre les fonctionnalités à venir de la bibliothèque numérique. Gallica Labs est une plateforme de test qui donne accès aux mêmes contenus que Gallica. Seuls l’habillage graphique, le moteur de recherche et les fonctionnalités qui lui sont associées la distinguent de son homologue.
Le nouveau moteur offre trois nouvelles fonctionnalités disponibles à partir de la recherche simple et de la recherche avancée : l’aide à la saisie, la recherche floue et l’expansion par synonyme.