Contrôle qualité des données OCR
Les entités participant au financementLes services BnF et leurs rôles
- pôle Contrôle qualité : pilote
Les acteurs BnF et leurs rôles
- Laurent DUPLOUY (service Numérisation) : chef de projet
- Yohann LE TALLEC (service Numérisation) : chef de projet
- Ahmed BEN SALAH (service Numérisation) : doctorant
Les groupements
Description
L’objectif du projet proposé est de permettre à la Bibliothèque nationale de France, au terme du plan triennal 2010-2012, d’implémenter un outil de contrôle innovant des fichiers résultats de la reconnaissance optique de caractères (OCR) produits dans le cadre des opérations de numérisation. Les volumes croissants de fichiers numériques traités via des logiciels d’OCR rendent en effet nécessaires la maîtrise par la BnF du niveau de qualité des données OCR livrées.
- 01/01/2013 - 31/12/2015 Plan triennal de la recherche 2013-2015
- 01/01/2013 - 31/12/2015 . . Inventaire des incunables scientifiques de la bibliothèque de l’Arsenal. Section Histoire
- 01/01/2013 - 31/12/2019 . . Connaissance et valorisation de la collection Charles Cros : création d’un catalogue raisonné numérique
- 25/09/2016 - 29/09/2016 . . . . IASA 2016 Annual Conference
- 01/01/2014 - 31/12/2015 . . Contrôle qualité des données OCR
- 23/08/2015 - 26/08/2015 . . . . 13th International Conference on Document Analysis and Recognition (ICDAR 2015)