Modèles et outils d’apprentissage profond (ModOAP)
Les entités participant au financementLes partenaires et leurs rôles
- Modèles, Dynamiques, Corpus : partenaire
- La Contemporaine : partenaire
- Huma-Num : partenaire
- Centre des sciences de la littérature française : partenaire
Les services BnF et leurs rôles
- département d'Orientation et de Recherche bibliographique : partenaire : BnF Data Lab
Description
Le projet ModOAP est conçu autour de deux objectifs principaux. En premier lieu, nous souhaitons développer une boîte à outils d’analyse de données massives pour des projets consacrés aux Sciences Humaines et Sociales. Elle reposera sur des modèles pouvant être aisément adaptés à différents types de corpus textuels et graphiques, et comportera des programmes réutilisables par les institutions et laboratoires impliqués dans le Labex, et plus généralement par l’ensemble de la communauté scientifique en SHS. Ces outils (classification d’images, d’unités textuelles, reconnaissance de structures, détection de similarités…) feront l’objet d’une élaboration collective en partenariat avec d’autres projets du Labex et d’ateliers de formation à destination des chercheurs. En second lieu, ce projet vise à expérimenter ces outils sur deux corpus particulièrement importants pour l’analyse de la construction d’une mémoire collective : les manuels scolaires, à travers les fonds numérisés par la BnF, et le photoreportage, par le biais du fonds Kagan conservé à La Contemporaine. Grâce à l’analyse de données massives permise par les outils d’apprentissage profond, nous souhaitons explorer la construction d’une mémoire institutionnelle et scolaire et sa transmission par les manuels, et comprendre la manière dont la presse peut contribuer à la formation d’une mémoire collective médiatique, par la réutilisation et la rediffusion d’images sur le temps long.
Responsable du projet
Julien SCHUH , Université Paris Nanterre - CSLF EA 1586
Partenaires au sein du labex Les passés dans le présent
- Bibliothèque nationale de France (BnF)
- Centre des Sciences des Littératures en langue Française (CSLF) - EA 1586
- La contemporaine | bibliothèque, archives, musée des mondes contemporains
- Modèles, Dynamiques, Corpus (MoDyCo) - UMR 7114
- Huma-Num : la TGIR des humanités numériques
- Projet ANR "Numapresse", http://www.numapresse.org/
- Projet ARTEC "La preuve par l'image", http://eur-artec.fr/2020/02/03/la-preuve-par-limage-de-la-contre-histoire-au-complotisme/
- Projet IUF "Synthétismes fin de siècle", https://crimel.hypotheses.org/1317