Une équipe du Mans développe un moteur de recherche sur les expériences de lecture
16 mars 2022
- Pays de la Loire
- Unité de Recherche
Le laboratoire 3L.AM – Langues, Littératures, Linguistique des Universités d’Angers et du Mans est un des plus importants en sciences humaines et sociales des Pays de la Loire. Les travaux réalisés portent sur les pratiques culturelles de la jeunesse, la circulation des savoirs et l’étude des cultures savantes et populaires. Brigitte Ouvry-Vial, spécialiste de littérature française du XXe siècle et de sciences de l’information et communication, s’est plus particulièrement spécialisée dans l’analyse des expériences de lecture à travers l’Histoire. À partir du XIXe siècle, la massification de la lecture, la diversification des pratiques ou, plus récemment, la révolution numérique font de l’observation des motivations et processus de lecture une entreprise compliquée. Le domaine de recherche des Book Studies, ou Histoire du livre, a déjà permis de mettre clairement en évidence qui lit, quoi et où, depuis la Renaissance : « Mais savoir pourquoi et comment les lecteurs lisaient ou lisent est à peu près impossible, car la lecture est une activité mentale qui ne peut être observée directement et ne laisse que des traces indirectes, remaniées après-coup, comme des commentaires ou des souvenirs… » explique Brigitte Ouvry-Vial.
C’est l’objet du projet européen Reading Europe Advanced Data Investigation Tool qu’a porté la chercheuse avec un consortium de chercheurs venant de cinq laboratoires partenaires principaux (répartis dans quatre pays : France, Angleterre, Pays-Bas, la République tchèque) entre 2018 et 2021. Le projet visait à réaliser une base de données et un moteur de recherche, par concept ou mot-clé (et partiellement à partir d’images), capable de détecter des informations sur les habitudes de lecteurs du XXe siècle dans une multitude de sources historiques en plusieurs langues, non numérisées et, pour certaines, manuscrites. Ce système, comparable à Google Images, s’est appuyé sur de grandes quantités d’archives et la mise au point d’une interface d’annotation des sources : « Le système devait nous permettre de repérer les circonstances de lecture évoquées par un commentateur, les effets, voire les émotions qu’une lecture a procurées. Trouver des constantes entre des milliers de témoignages de lecteurs différents est d’autant plus difficile qu’il n’existe pas une expérience qui ressemble à une autre », détaille Brigitte Ouvry-Vial.
Ce projet a ainsi demandé un premier travail de définition des « patterns communs » autour de l’expérience de lecture du XVIII au XXIe siècle entre tous les partenaires. Ce projet a également exigé une forte coopération avec des équipes d’informaticiens. L’IRISA, un des trois acteurs partenaires du projet sur les aspects « techniques », a joué un rôle clé : « Nous avons conçu plusieurs traitements automatiques des données pour les “préannoter” », explique Guillaume Gravier, directeur de recherche à l’IRISA. Le travail a débouché sur l’élaboration d’un algorithme capable de repérer les passages de textes ou d’images désignant de manière plus ou moins explicite une expérience de lecture. « Aujourd’hui, les détections de notre moteur de recherche sont avérées dans neuf cas sur dix », explique François Vignale, conservateur en chef à l’Université du Maine et spécialiste d’Humanités numériques au sein du laboratoire 3LAM.

Ce moteur de recherche a très vite attiré des industriels, à la recherche d’outils pour mieux analyser les perceptions des usagers de leurs produits, comme les nouvelles parutions d’un éditeur, d’un parfumeur ou d’un groupe de musique. Pour l’instant, la technologie développée par READ-IT a été utilisée pour capter les émotions autour d’événements culturels. Elle a permis de mener des enquêtes auprès de lecteurs dans des animations en bibliothèque, à la Fête de la science, etc. Mais un projet de valorisation ambitieux pourrait voir le jour prochainement en collaboration avec Radio France. L’équipe scientifique a obtenu l’autorisation de numériser et d’explorer une partie des 35 000 lettres d’auditeurs-candidats, reçues à l’occasion du prix du Livre Inter et de l’organisation du jury. Il s’agit de mettre les résultats des analyses qualitatives et quantitatives au service d’une histoire « émotionnelle » de ce prix littéraire radiophonique.