Colloque

Vidéoethnographie des usages de la bibliothèque numérique Gallica : une exploration au plus près de l’activité

Nicolas Rollet

Valérie Beaudouin

Isabelle Garron

Membre a labase

Nicolas Rollet : Mines ParisTech

Résumé de la communication

Dans le cadre d’un projet associant la Bibliothèque nationale de France, le labex Obvil et Télécom ParisTech, plusieurs modalités d’enquête (entretiens, questionnaire en ligne, vidéo-ethnographie) ont été mobilisées pour mieux appréhender les publics en ligne. En particulier, poussés par le souhait de renouveler les manières d’étudier les usages des bibliothèques en ligne, nous nous sommes orientés vers une approche vidéo-ethnographique, afin de documenter comment des utilisateurs organisaient leur consultation de la bibliothèque Gallica en situation. Nous avons mobilisé le protocole SEBE (Subjective Evidence Based Ethnography), développé par Saadi Lahlou, qui combine prise de vue subjective et entretien d’autoconfrontation – auprès d'une dizaine de personnes. Cette approche permet de documenter l'usage de Gallica d’une façon inédite, dans la mesure où les personnes sont invitées à reconstituer leurs raisonnements, à expliciter à chaque instant quels étaient leurs buts.
Nous nous sommes en particulier intéressés à deux aspects de l'usage : 1) les processus d'évaluation et de catégorisation en jeu dans les résultats d'une recherche, dans la consultation d'une liste, ou dans la perception d'un document 2) la dimension écologique de l’usage de Gallica, qui s'inscrit dans un contexte de multiactivité (à l'écran et hors écran) fait d'interruptions, de bifurcations et de collaborations, renforçant son analyse en tant que pratique sociale.

Résumé du colloque

À l’ère d’Internet, l’accès à un volume conséquent de publications a des incidences sur le travail des chercheurs, leur positionnement dans la communauté internationale, l’évaluation de la recherche et les modèles économiques sous-jacents.

Le développement des données en libre accès (open data) ainsi que les bibliothèques, archives et musées en ligne ne sont que quelques exemples illustrant l’évolution de la notion de texte ou de document, sa diversité et sa prolifération.

Des collections issues de bibliothèques traditionnelles sont maintenant accessibles librement, comme Gallica et Digital Public Library of America. À ce type de bibliothèques numériques s’ajoutent les publications savantes, qui sont une part importante des publications numériques. Des acteurs francophones importants ont vu le jour aussi bien au Canada qu’en France (Persée, Cairn.info, HAL et Érudit). De récentes initiatives nationales ont également permis le développement d’importantes archives scientifiques (ISTEX en France, Swissbib en Suisse, GBV en Allemagne et Scholars Portal en Ontario) ou muséales (Europeana et Musée virtuel du Canada).

Parallèlement, les méthodes automatisées de traitement se diversifient et se spécialisent : fouille de texte, méthodes d’apprentissage profond (deep learning) pour traiter des données massives et transformation d’informations en données liées. Cependant, de nombreuses questions restent en suspens, notamment en ce qui concerne la gestion de gros corpus multithématiques. Pouvoir disposer d’outils d’analyse efficaces capables de s’adapter à de gros volumes de données, souvent de nature hétérogène et non toujours structurés, dans des langues variées et des domaines très spécialisés, reste un défi.

Le traitement des données numériques implique de multiples domaines (traitement automatique des langues, intelligence artificielle, linguistique, statistiques et informatique), permettant des applications diversifiées : recherche d’information, veille, évaluation de programmes de recherches, prospective, etc.