Exploiter les données d'usage et de prêt en bibliothèques : le prototype Prévu à Paris 8

Par Catherine MULLER le 12 janvier 2016

Le contexte du projet Prévu

Le projet Prévu a été initié en 2013 par Gaétan Darquié, doctorant au laboratoire CiTu (Paragraphe Paris 8) et porteur du projet, Isabelle Breuil, alors conservatrice à la Bibliothèque universitaire de Paris 8, et Mehdi Bourgeois, chargé de projets numériques au Labex Arts-H2H en partenariat avec l’EnsadLab et le Campus Condorcet.

Le projet Prévu vise à visualiser au sens propre « les prêts vus » – d’où son nom – en ouvrant l’accès aux données bibliographiques et de circulation de la bibliothèque. La mise en place de cette plateforme innovante, pionnière dans les bibliothèques universitaires françaises, a été possible à l’occasion du changement de SIGB de la BU en 2012 pour une solution Open source (Koha) qui a permis non seulement de fédérer les données de prêts de la BU, mais surtout de « libérer » les données de circulation pour pouvoir les « manipuler » moyennant une procédure d’anonymisation du lectorat, conformément aux recommandations de la CNIL.

Les premiers scénarios de visualisation

Actuellement, le projet Prévu se trouve dans sa deuxième année d’existence, le site prevu.fr rend compte du travail effectué lors de la première année et vise à matérialiser un premier ensemble de scénarios d’usage pour expliciter les potentiels de la base de données. Concrètement, ont été versés dans la base, l’ensemble des notices bibliographiques de la bibliothèque universitaire, les données de circulation des documents, la base des lecteurs inscrits anonymisés et les transactions effectuées. On compte en 2014 320 000 prêts pour 32 000 lecteurs et 400 000 documents.

Les scénarios de visualisation proposés dans cette 1ère phase du démonstrateur permettent de retirer un certain nombre d’informations factuelles des données de prêt recueillies et du nombre des transactions, notamment sur les événements structurant la vie de la bibliothèque et de l’université. Par exemple, l’historique des prêts et des records rend parfaitement compte des rythmes universitaires et des périodes d’examens. Constat plus subtil, mis en valeur par les données et significatif des mutations à l’œuvre dans les usages de lecture, la courbe décroissante des inscrits s’avère largement relativisée par l’augmentation des emprunts dans le même temps. D’autres exploitations plus stratégiques sur le lectorat et ses pratiques sont d’ores et déjà possibles, qui témoignent du fort potentiel informationnel de la plateforme. Qui sont les lecteurs ? Etudiants des 1ers cycles, doctorants, enseignants ? Quelle composante de l’université est la plus gourmande en documentation, ou à l’inverse, laquelle se fait plus discrète ? Mémoire identitaire forte de l’université, la liste des livres les plus empruntés à l’échelle de Paris 8 fait apparaître un best-off de personnalités décisives dans l’histoire de l’institution : Gilles Deleuze, Hélène Cixous, Michel Foucault, etc. Intéressant, une cartographie géo-localisée permet d’appréhender en finesse les flux et la répartition des lecteurs actifs sur le territoire francilien.

Ainsi que le souligne Mehdi Bourgeois, bien d’autres scénarios sont imaginables pour comprendre les stratégies documentaires de recherche des publics, identifier les mots-clefs de recherche, repérer des typologies et des communautés de lecteurs. Une des explorations proposée permet de trier les données par UFR ; ainsi un doctorant peut savoir quels sont les ouvrages les plus populaires de son école doctorale. Précieux également, l’identification des secteurs où les livres sont les plus empruntés, permet de voir si l’UFR favorise une discipline ou au contraire l’interdisciplinarité. La plateforme Prévu met ainsi librement à disposition pour tout auteur ou tout ouvrage les données de prêt qui lui sont associées, ouvrant ainsi une voie toute tracée à l’ingénierie de la recommandation et des algorithmes.


Bibliothèque et Humanités numériques

Ce prototype résolument inscrit dans le champ d’expérimentation des Humanités numériques favorise de nouvelles pratiques de recherche documentaire et de nouveaux usages scientifiques par le biais de visualisations des données. Le champ d’étude des digital humanities se situe en effet au croisement des potentialités du traitement informatique des données et des pratiques de recherche en SHS. L’exploitation des données et métadonnées permet ainsi de questionner l’emprunt de documents en bibliothèque – à ce jour le corpus est limité au format imprimé – et d’imaginer de nouveaux services ou API possibles.

Le dernier ThatCamp 2015 de Paris qui réunissait comme chaque année les acteurs des humanités numériques, chercheurs, ingénieurs, bibliothècaires et designers, interrogeait entre autres l'inscription institutionnelle et transdisciplinaire des humanités numériques ; l'occasion également pour l'équipe du projet de venir présenter le prototype Prévu au cours d'un atelier où les participants étaient invités à envisager d’autres scénarios d’usage pour donner du sens aux données exposées par la plateforme sous forme de visualisation.

Les enjeux du projet Prévu sont à la croisée de 3 mutations majeures de la recherche en SHS : la dimension expérimentation propre aux humanités numériques, l’accompagnement des bibliothèques à l’innovation, notamment dans les pratiques documentaires, avec l’ouverture et la valorisation des données numériques. Mais c’est aussi, ainsi que le souligne Isabelle Breuil, un formidable dispositif de médiation numérique pour le bibliothécaire qui lui permet de mieux cerner son public, – le rêve de tout bibliothécaire – ses comportements documentaires, et partant, probablement le gage d’une meilleure réponse aux attentes utilisateur.

La bibliothèque universitaire a toujours été un interlocuteur privilégié de la recherche. D’abord par sa neutralité relative aux ancrages disciplinaires de l’université qui font d’elle un partenaire naturel de « collaboration et d’apprentissage de nouvelles compétences »1. Mais aussi parce qu’elle dispose d’« infrastructure et de compétences qui rencontrent directement les besoins méthodologiques des chercheurs en humanités numériques »2, notamment dans le signalement, l’indexation, la conservation, l’archivage, la numérisation des collections, la gestion de catalogues et de la documentation électronique, ou encore la curation et la dissémination de contenus. Avec l’impératif de penser « la bibliothèque hybride », les dispositifs de médiation numérique, sont devenus primordiaux pour éviter la désolidarisation de la bibliothèque physique et virtuelle. La plateforme fédératrice de données Prévu est particulièrement bien adaptée à « l’intégration d’autres services tournés vers une bibliothèque hybride, un espace où l’application numérique renforce le lieu physique »3.

Un dispositif de médiation numérique

Cette nouvelle approche de repositionnement et de libération des données ne vise pas seulement à optimiser la circulation des emprunts, mais également à les documenter et les valoriser. La fonction de médiation numérique, chère aux bibliothécaires, est au cœur de l’expérimentation du prototype Prévu. Le bibliothécaire Xavier Gallaup4 a montré combien « l’appropriation des contenus par leur destinataire et la mise en relation des usagers avec les contenus qu’ils cherchent, voire […] l’inattendu », auxquelles vise la médiation, sont de plus en plus complexes dans un contexte de désintermédiation et d’économie de l’attention, « face à une profusion et une dispersion des contenus alliées à une expertise plus grande des usagers et un besoin de personnalisation croissant ».


Ainsi que le résume Isabelle Breuil, l’enjeu de la médiation numérique est alors de faire passer l’usager de l’information à la connaissance, de susciter la rencontre fortuite, la “sérendipité“, de donner à voir et en partage les savoirs afin de contribuer à la construction de connaissances. La référence à la notion de « dispositif » du philosophe Agamben éclaire la part de subjectivation inhérente à toute forme d’appropriation des connaissances. A ce titre, le dispositif Prévu joue exactement ce rôle de passerelle dont la caractéristique est de proposer une interface entre un milieu tangible – les collections imprimées – et des données numériques5. Les données d’usage de la bibliothèque, en l’occurrence les données de prêts, permettent de ré-agencer et de redistribuer l’accès aux documents, selon un ordre reflétant une certaine communauté d’intérêts intellectuels.

Plusieurs formes de rapprochement avec l’usager sont envisageables, à commencer par l’outil de recherche bibliographique que Prévu propose en fournissant un système d’indexation beaucoup plus plastique que les normes classiques de classification du catalogue, largement sous utilisées désormais. L’outil offre également des capacités précieuses d’évaluation et de gestion des fonds, par exemple pour déceler l’insuffisance ou à l’inverse le trop plein d’exemplaires. Ainsi, le projet rejoint-il l’interrogation vive des bibliothèques sur les missions qu’elles doivent remplir dans un contexte de mutation numérique, et « sur les manières dont elles seront investies demain ».

L’avenir de Prévu

La plasticité des données et de la plateforme invite à imaginer d’autres scénarii de visualisation, greffer d’autres couches de service, déployer un réseau social autour des communautés de lecteurs, de partage des annotations ou d’affinités documentaires, ou encore utiliser l’outil pour d’autres projets de dématérialisation et de réalité augmentée. C’est ainsi que l’ENSADLAB, partenaire du projet, a misé sur le potentiel artistique de Prévu pour développer un dispositif en 3D, Bibliomémos, une application réalisée par Donatien Aubert, destinée à spatialiser les données transmises par la plateforme, qui offre aux usagers la possibilité de se promener à travers les ouvrages. Ainsi que le conclut Isabelle Breuil, l’enjeu de la spatialisation de la médiation numérique, loin de viser à remplacer la bibliothèque physique et sa sociabilité par le numérique, est « d’aborder le savoir en réintroduisant dans des mondes numériques nos habitudes spatiales et de “sémantiser“ nos interactions dans ces environnements par le biais d’une architecture symbolique ». Cette expérimentation prometteuse ne peut qu’inciter les bibliothèques à adopter des SIGB et des solutions interopérables et adaptables pour ouvrir et faire parler leurs précieuses données6.


Notes

[1Livre post-numérique : historique, mutations et perspectives, Actes du 17e colloque international sur le document électronique, 19-20 novembre 2014, ESISA, Fés, Maroc, sous la direction de Khaldoun Zreik, Ghislaine Azemard, Stéphane Chaudiron, Gaétan Darquie, 2014, Paris, France : Europia. Organisé à l’ESISA, Fés, Maroc par CiTU – Paragraphe, IDEFI – Creatic, Université Paris 8, GERiiCO, Université de Lille. 
[2Ibid. 
[3Ibid.
[4] Développer la médiation documentaire numérique sous la direction de Xavier Galaup, Presses de l’enssib, 2012. 
[5
C’est ici une autre définition du dispositif de médiation numérique formalisée en 2012 par Silvère Mercier dans son blog Bibliobsession.
[6] On suivra avec d'autant plus d'intérêt sur ces problématiques la journée d'étude de l'enssib consacrée à l'exploitation des données d'usages en bibliothèques au cours de laquelle sera présenté le projet Prévu.

 

Tags : Données d'usage, Médiation numérique, Visualisation données, Algorithmes, Innovation numérique, Dispositif, Prototype, Prévu, Humanités numériques, Humanités digitales, Sigb, Open source, Bibliothèque universitaire de Paris 8, Labex Arts-H2H, EnsadLab, Campus condorcet, laboratoire CiTu

Liens réseaux sociaux