Watson-Web : analyse des textes, sélection et outils nouveaux

Description

Dans le cadre de l'appel à projet Technolangue du Ministère de la recherche, la BnF a été partenaire du projet Agile/Watson.

À partir de technologies utilisées dans le traitement automatique de la langue, et dans une optique d'accès et de détection des contenus, l'objectif était d'en appliquer les principes au pré-filtrage, catégorisation et extraction-résumé de données collectées pour le dépôt légal du Web et de les évaluer. Un outil a été développé et le projet Watson a été l’occasion d'utiliser les captures de sites réalisées par la BnF lors des élections présidentielles et législatives 2002, en se plaçant du point de vue du chercheur qui souhaiterait travailler sur de tels corpus.

Dans le prolongement du programme, un pilote d’utilisation par un groupe de chercheurs de ce corpus, complété par les élections régionales et européennes 2004 a été réalisé.
Le produit ayant servi au développement de l'outil dans Watson a été acquis par la BnF et mis en œuvre en complément des autres outils d’accès aux archives web développés dans le cadre du consortium IIPC.

En savoir plus : Site de l’IIPC