Document numérique et information scientifique et technique : introduction

Qu’est-ce qu’un document numérique ?

Depuis maintenant 30 ans, le document numérique est un objet fédérateur de recherche en sciences de l’information : au cœur de l'informatique et des dites "Nouvelles Technologies de l'Information et de la Communication" dans les années 90, il est une des problématiques récurrentes de l’IST1 traitée par les professionnels de l’information sous différentes facettes : construction, description, pérennisation2, indexation, évaluation3, recherche. La transformation du paysage informationnel à l’ère du Web de données réactualise aujourd’hui encore l’interrogation sur la nature même du document numérique : Qu’est-ce qu’un document numérique ? Quelles en sont les frontières constitutives ? Ce qui le structurait dans ses aspects techniques et sémantiques ne l’apparente-t-il pas moins aujourd’hui au document qu’à une pièce de ce gigantesque ensemble de données ?4

Ainsi que l’analysent Jean-Michel Salaün5 ou encore Alexandre Monin6, le XXIe siècle consacre la transformation du document en pure donnée informationnelle, ressource définie par une adresse fixe, l’URI ou "uniform resource identifier ", cet identifiant qui inverse la logique classique de "documentarisation"7. Le savoir ne se construit plus en référence aux documents qui le constituent, mais se réinterprète sans cesse à la volée dans le système computationnel en fonction des ressources disponibles, décodées par le langage des machines, ainsi que des données qui lui sont liées. Comme l'observe Hervé le Crosnier, « d'un matériel destiné à un lecteur humain, le document numérique devient un enjeu pour l'usage des "robots lecteurs" qui vont "extraire la connaissance".»8 

Bibliothèques numériques

Outils de structuration, de signalement et d’accès au document numérique, les bibliothèques numériques occupent une place privilégiée au cœur du système documentaire et des technologies de gestion de l’information9. Les politiques en matière d’information scientifique et technique leur accordent depuis les années 2000 un rôle stratégique, notamment dans la diffusion et le libre accès au patrimoine culturel et scientifique. Par leur capacité à agréger et fédérer l’accès au document numérique, la bibliothèque numérique garantit l’accès à l’information scientifique, contribue à l’ouverture des données de la recherche et participe à l’édition scientifique : qu’elle fédère la production de corpus numérique scientifique ou patrimoniale, l’archivage de publications de recherche ou encore l’accès unifié aux ressources électroniques de la bibliothèque. La construction des bibliothèques numériques va de pair avec la mise en œuvre de politiques documentaires adaptées, orchestrées au niveau national par des dispositifs de soutien pour accompagner la mutation numérique et l'offre documentaire des bibliothèques : la Bibliothèque Scientifique Numérique (BSN), qui aujourd’hui « structure le paysage de l’IST en France », pour les bibliothèques de l'Enseignement supérieur et les Bibliothèques Numériques de Référence (BNR) pour les bibliothèques publiques.

Politique documentaire du document numérique

À la fois chef d’orchestre et clef de voûte de l’organisation des collections numériques, les politiques documentaires des bibliothèques à l'heure d'internet10 assurent au corpus numérique son intelligibilité documentaire. Intelligibilité d'autant plus cruciale pour les bibliothèques que l'intégration des ressources numériques à la politique documentaire ne va pas de soi11 : à la difficulté sémantique de définir le périmètre dématérialisé - tour à tour qualifié de ressources numériques, documentation électronique, bibliothèque numérique ou encore services en ligne - s'ajoute la pluralité des procédures économiques, juridiques et de formation professionnelle en jeu, des modalités d'acquisition, de signalement, de conservation et d'évaluation, jusqu'à la formation des bibliothécaires à la médiation numérique et la formation des usagers. Une définition extensive, utilisée particulièrement dans les universités, considère la politique documentaire comme l’ensemble des objectifs et processus pilotant la gestion de l’information, incluant non seulement les activités des bibliothèques, mais aussi la formation des étudiants à la maîtrise de l’information12 et aux pratiques documentaires numériques à l'université ainsi que les flux eux-mêmes des ressources documentaires qui irriguent les composantes universitaires, sous la qualification initiale de "documentation électronique".


[1] L’information scientifique et technique (IST) désigne l’ensemble des données et publications sur lesquelles se nourrit, s’appuie et se prolonge un travail de recherche universitaire et par extension l’ensemble des informations nécessaires aux professionnels de la recherche, de la documentation, de l'enseignement, de l'industrie et de l'économie, quelle que soit la discipline concernée. Ce concept est apparu dans les années 1960, en raison de l’évolution des technologies de l'information et de la communication, et a été utilisé dans un grand nombre de sigles (BNIST en 1973, MIDIST en 1979, INIST en 1988, URFIST et DBMIST en 1982, CADIST, SUNIST en 1984… et FORMIST en 1999).

[2] INRIA, Séminaire IST et informatique, 2006. Pérenniser le document numérique. Paris, France : ADBS. 

[3] BOUKACEM-ZEGHMOURI Chérifa (dir.), 2010. L’information scientifique et technique dans l’univers numérique: mesures et usages. Paris, France : ADBS. 

[4] L'ensemble de ces interrogations ont été soulevées lors du séminaire Inria qui se tenait en octobre 2012 sur « Le document numérique à l'heure du web de données ».

[5] Voir l'intervention de Jean-Michel Salaün au séminaire Inria de 2006, « Obsolescence ou persistance du document : du document à la donnée »

[6] Les travaux de recherche d'Alexandre Monin, docteur en philosophie, qui a consacré sa thèse en 2013 à la philosophie du Web, s'intéressent aux résonnances de l'architecture du Web sémantique avec les problématiques classiques de la métaphysique et de la philosophie du langage autour des ontologies. Des trois composantes clefs de l'architecture du Web, que sont le protocole de communication HTTP et le langage de représentation HTML/RDF, c'est l'URI, dont la fonction est de savoir identifier et nommer n'importe quelle "ressource" web, qui consacre le passage du web de documents au web de données

[7] Une analyse de fond sur la notion de "documentarisation" et de "redocumentarisation" née avec le numérique a été conduite en 2007 par Jean-Michel Salaün dans « La redocumentarisation, un défi pour les sciences de l’information », Études de communication [En ligne]. Les sciences de l’information, construites sur la base d’un processus de documentarisation démarré à la fin du XIXe siècle, sont avec le numérique confrontées à la nécessité de se renouveler. Le mouvement actuel s’apparente à une redocumentarisation et fait appel à de multiples disciplines pour se développer. 

[8] Citation extraite du cycle de cours d'Hervé le Crosnier, enseignant-chercheur à l'Université de Caen, consacré à la culture numérique, disponible sur CanalU au format vidéo :  Qu’est-ce qu’un document ?

[9] ANDRO, Mathieu, ASSELIN, Emmanuelle, MAISONNEUVE, Marc et TOSCA CONSULTANTS, 2012. Bibliothèques numériques: logiciels et plateformes. Paris, France : ADBS.

[10] CALENGE, Bertrand, 2008. Bibliothèques et politiques documentaires à l’heure d’Internet. Paris, France : Éditions du Cercle de la librairie.

[11] BARRON, Géraldine et LE GOFF-JANTON, Pauline (éd.), 2014. Intégrer des ressources numériques dans les collections. Villeurbanne, France : Presses de l’Enssib.

[12] RENCONTRES FORMIST, 2011. La formation des doctorants à l’information scientifique et technique. Villeurbanne (Rhône), France : Presses de l’Enssib.