Segmenter et annoter les images : déconstruire pour reconstruire

Les partenaires et leurs rôles
Les services BnF et leurs rôles
Les acteurs BnF et leurs rôles

Description

L’objectif de cet atelier est de présenter les méthodes mises en place par différentes équipes de travail dans le processus de segmentation et d’annotation des images. Ce procédé constitue une étape importante dans le développement des projets réunis à cette occasion : Cremma, GallicaSnoop, LECTAUREP, PENSE, REMDM, Richelieu. Histoire du Quartier, et SegmOnto. Par leurs enjeux scientifiques respectifs, chaque projet développe un certain rapport à l’image, qui implique des décisions sur la granularité ou le niveau de précision.

Il s’agira d’exposer la nature des corpus rassemblés dans ces programmes de recherche, et d’analyser les approches mises en place pour expliciter et désigner les contenus de ces documents, textuels et/ou iconographiques. Interroger les procédés permet également d’observer les pratiques à la loupe : comment les images sont-elles annotées ? En faisant le choix de fragmenter des informations contenues dans les documents afin de les classer, de les compléter et de les exposer, on propose une nouvelle lecture de l’oeuvre. Si cette démarche améliore la valorisation et la navigation dans les sources, elle permet également à l’historien de porter un autre regard sur son objet d’étude. Le traitement du champs et du hors-champs, l’emploi de vocabulaires contrôlés pour nommer les contenus, et le croisement et l’enrichissement des sources seront ainsi évoqués.

La pertinence de proposer une méthode commune constitue un autre enjeu, en fonction des problématiques rencontrées dans chacun de ces projets. La segmentation et l’annotation d’images, automatisées ou manuelles, mobilisent des outils, produisent des données, enregistrées dans des formats, et se réalisent grâce à des protocoles de traitement et de transfert d’informations. Sans tomber dans l’écueil d’une normativité stricte, on peut interroger ces pratiques partagées : telles le recours à IIIF ou au Web Annotation Protocol, l’emploi de vocabulaires ouverts liés ou de certaines ontologies, ou encore l’adoption de stratégies communes d’annotation... Enfin, dans une perspective de science ouverte et collaborative, la capacité et la facilité d’accès et de réutilisation des données reste un enjeu à appréhender. En croisant ces projets, il s’agit de préciser ce que l’on entend par *segmentation* et *annotation* dans des projets d’humanités numériques.


Documents disponibles