Moteur de recherche sémantique de Gallica
- bureau Études et accompagnement : pilote
- Sylvie FLORES (bureau Études et accompagnement) : chef de projet, pilote
Description
Financement : BnF sur ses ressources.
Objectif :
Doter la bibliothèque numérique Gallica d’un moteur d’indexation et de recherche sémantique pour faciliter l’accès à ces ressources. Le moteur CloudView conçu par la société Exalead a été choisi. La plate-forme de tests a été livrée le 4 mai 2011. Les fonctionnalités linguistiques suivantes sont activées à la recherche : lemmatisation (singulier/pluriel, masculin/féminin), recherche approchée par phonèmes et par distance de Levenstein. Le regroupement de résultats (« Collapsing ») permet de regrouper les documents en fonction d’une clé et de n’afficher qu’un résultat (le document le plus pertinent de l’ensemble) représentant le regroupement, de ne montrer qu’un volume issu d’un ensemble de livres, images…, de ne retrouver qu’un fascicule/périodique sur un ensemble de fascicules.
À l’été 2012, le moteur a été mis à la disposition des utilisateurs, aux fins de tests, sur le site Gallica Labs (url : <http://gallicalabs.bnf.fr/>) qui offre les fonctionnalités à venir de la bibliothèque numérique. Gallica Labs est une plateforme de test qui donne accès aux mêmes contenus que Gallica. Seuls l’habillage graphique, le moteur de recherche et les fonctionnalités qui lui sont associées la distinguent de son homologue.
Le nouveau moteur offre trois nouvelles fonctionnalités disponibles à partir de la recherche simple et de la recherche avancée : l’aide à la saisie, la recherche floue et l’expansion par synonyme.