émergence rapide, brutale à l'échelle de l'histoire de la documentation, des nouvelles technologies a provoqué bien des bouleversements dont nous n'avons pas fini de prendre la mesure. Pour les professionnels comme pour les publics, entre politiques et pratiques documentaires, l'adaptation se fait par à-coups, expériences et tâtonnements. Dans le cadre privilégié de la bibliothèque de l'Institut Pasteur, la recherche documentaire électronique est déjà une réalité quotidienne.
Ces dernières années, les politiques documentaires en matière d'information électronique ont eu avant tout pour but (ou pour seul choix) de suivre l'évolution des technologies des supports informatiques. Suivre l'actualité, découvrir les produits, les tester, voire les étrenner, telle a été notre tâche. Les politiques se construisaient au rythme de l'évolution des techniques. Nous avons donc joué un rôle auprès des fournisseurs en ce qui concerne l'amélioration des contenants. Parfois ce fut à nos dépens : on ne peut s'empêcher, au souvenir de certaines expériences, de penser que nous avons quelquefois servi de cobayes pour des produits qui manquaient sérieusement d'achèvement.
La veille documentaire pour les produits électroniques s'organise concrètement autour des quatre grands axes dont il sera question ici : multimédia, bases de données, périodiques et Internet. Les premiers critères de sélection sont comme partout les besoins et les impératifs budgétaires (1) . Mais les critères techniques ont rapidement évolué : les capacités de stockage, les problèmes de mémoire ne sont plus des facteurs limitants. En revanche, l'organisation et l'accès à l'information sont plus que jamais à l'ordre du jour : on parle hypertexte, formats ou moteurs de recherche.
Par leur diversité, ces supports émergents ont introduit dès le début des années 1980 l'évolution qu'Internet allait consacrer dans la notion de document : à savoir que cette notion devient peu à peu obsolète pour faire place au concept d'information circulante, libre de toute contrainte. Trop libre parfois : on ne maîtrise plus ni son origine, ni sa circulation, ni son utilisation. Rapidité, validité, permanence et autonomie sont les points les plus sensibles de ce nouvel environnement documentaire.
Comme dans la plupart des secteurs de recherche, la rapidité d'accès à l'information est un élément clé de la réussite. Dans ce domaine, Internet a beaucoup apporté en documentation. L'exemple des périodiques électroniques est typique : le dernier numéro est toujours disponible avant l'édition papier, et les usagers sont de plus en plus nombreux à utiliser les accès en ligne.
De manière plus générale, la messagerie électronique et les transferts de fichiers nous ont affranchis de la plupart des délais postaux. Les puissants centres de calculs disponibles aux quatre coins de la planète résolvent en une nuit des problèmes qui auraient pris des semaines auparavant (comparaison de séquences en biologie moléculaire par exemple).
Le problème de la validité de l'information scientifique, et particulièrement médicale, ne se pose pas avec autant d'acuité pour tous les publics. Dans les domaines d'exercice de l'Institut Pasteur, les sources documentaires sont relativement cernables et les producteurs de l'information encore suffisamment contrôlés pour éviter les risques majeurs.
Mais les requêtes aléatoires qui servent parfois de préalable à la découverte d'un sujet nouveau, ainsi que les activités individuelles de veille, laissent poindre déjà le risque d'attitudes par trop crédules. Les publics de la bibliothèque se diversifient avec l'ouverture à l'extérieur. Chaque niveau, comme chaque catégorie estudiantine ou professionnelle, recherche des informations d'origine et de facture différentes.
Enfin, dans les métiers de recherche dont les horaires journaliers dépendent souvent du déroulement des expériences en cours, il est important de pouvoir disposer d'accès à l'information même en dehors des horaires d'ouverture de la bibliothèque.
C'est aussi le rôle du serveur Web que d'autoriser cette permanence d'accès aux catalogues, bases et périodiques, dans un centre où il ne serait pas envisageable pour des raisons de sécurité d'ouvrir ses portes de nuit comme peut le faire une unité documentaire plus petite. Enfin, Internet répond avec bonheur au besoin naturel d'autonomie du chercheur : les coûts d'accès sont diminués, les interfaces ergonomisées.
Plusieurs espaces informatiques (bureautique, Internet, bases de données et multimédia) sont répartis dans la salle de lecture, en libre accès. Pour les bases de données, deux accès monopostes sont réservés à la consultation de cédéroms (Science citation index, Pascal, journal citation report). Les quatre autres, reliés à Internet pour servir les bases en réseau interne, ont vu leur public évoluer: la plupart dépassent largement le cadre de consultations bibliographiques pour utiliser le Web ou la messagerie électronique.
L'espace strictement Internet, composé de quatre postes (sans autres applications), est fréquemment saturé et sera porté prochainement à huit postes. L'espace bureautique (huit postes et une imprimante) est pris d'assaut chaque jour pour des usages divers, dont environ la moitié sur Internet... Enfin, deux postes équipés de casques audio et une imprimante constituent l'espace multimédia, principalement dédié à la consultation de cédéroms.
Ces postes ne sont pas encore reliés au réseau, mais cette évolution sera sans doute inéluctable, beaucoup de produits utilisant ou renvoyant vers des sites sur le Web. Cet espace dispose par ailleurs d'un complément virtuel puisqu'une partie de notre serveur Web lui est consacrée.
Le fonds multimédia (vidéos, diapositives et produits électroniques) reste très méconnu dans son ensemble, malgré les efforts de promotion entrepris (pages Web, annonces de nouveautés sur une liste de diffusion, affichage). Une enquête sur les usages et besoins à la bibliothèque réalisée en juillet 1998 révèle que 92 % des répondants en ignorent encore l'existence ou le contenu. Parmi les utilisateurs de cédéroms, la majorité s'accorde cependant à les trouver assez utiles (66 %), voire très utiles (25 %). Mais, sur 44 titres disponibles, un seul est consulté régulièrement, les deux tiers rarement, et un tiers très peu ou pas du tout. Ce faible résultat pour un fonds de trois ans d'existence peut s'expliquer simplement par le comportement des usagers, particulièrement face à une nouvelle technologie.
Dans un premier temps, il faudra se livrer à de véritables opérations de marketing pour garantir sa diffusion. L'existence d'un besoin est difficile à établir (partant du principe que le besoin vis-à-vis du contenu existe, ce qui est loin d'être évident au regard de la diversité des secteurs de recherche de l'Institut Pasteur). Sinon, il y a peu de chances qu'un usager le teste. Le contenant doit séduire ; or on constate parfois une concurrence entre un document traditionnel, sur papier, et sa version électronique.
Ainsi, un très réputé manuel de laboratoire, les Current Protocols, est de fait apprécié ici dans sa version électronique pour ses facilités de recherche, mais regretté dans sa version papier parce que les protocoles y étaient plus faciles à photocopier qu'ils ne le sont à imprimer (l'information se présentant de façon très fractionnée sur le cédérom). S'agit-il d'un produit nouveau ou d'un produit de remplacement ? S'il se révèle utile, son utilisation ne sera sans doute que ponctuelle et pas forcément immédiate.
Enfin se pose encore le problème de l'accès. Le produit est-il simple d'utilisation? Nécessite-t-il une formation ? Les structures nécessaires ont-elles été mises en place ? L'usager s'exprimera-t-il sur le résultat de son utilisation ?
On voit combien il peut être difficile d'en apprécier l'impact. En conséquence, étant donné la rapidité d'évolution des supports, plusieurs produits ont été abandonnés avant même que l'on ait pu apprécier leur impact. Ce fut par exemple le cas du cédérom Genome interactive database (GID), qui rassemblait plusieurs bases telles que Genatlas, aujourd'hui accessible gratuitement sur Internet (serveur Infobiogen).
Les documents d'accompagnement électroniques sont de plus en plus nombreux. Le « pressage d'un cédérom est peu coûteux, et il ne se passe plus de semaine sans que nous n'en recevions attachés à un ouvrage ou à un fascicule de périodique. Grâce au développement d'Internet notamment, il est véritablement facile de développer à peu de frais sous forme HTML un document qui pourra être lu avec un navigateur que l'utilisateur final possède déjà.
Ces documents accompagnent plus particulièrement les ouvrages concernant les domaines de l'informatique (modélisation moléculaire, programmation, Internet surtout...), mais aussi des mathématiques, des statistiques et de leurs domaines proximaux en biomédical : épidémiologie, santé publique... Les autres domaines ne sont pas en reste, de la cytologie à l'immunologie, à la pharmacologie ou aux méthodes de laboratoire, tous les contenus semblent possibles : logiciels d'analyse, glossaires interactifs, imagerie ou répertoires de liens sur le Web.
Les périodiques utilisent aussi ce support pour diffuser les comptes-rendus et résumés de congrès. Le traitement des documents d'accompagnement est le même que celui des autres documents, et ils sont prêtés sur demande au même titre que ceux-ci.
En termes de support utile, il est difficile de considérer Internet comme un outil pleinement multimédia. Certes, de nombreux sites existent qui proposent images, logiciels ou sons. Mais plusieurs obstacles s'opposent encore à leur succès. Tout d'abord, obstacle commun à tous les types de documents : l'organisation et l'accès à l'information. Avoir connaissance de son existence, aller la chercher ne sont pas des faits courants, surtout dans le cadre de la bibliothèque. Au mieux, on " tombe dessus ". Et puis l'offre est encore trop faible pour être popularisée.
La technique est aussi un obstacle, les équipements n'étant pas toujours adaptés. La multiplicité des formats oblige bien souvent à décharger pour la énième fois un nouveau logiciel si on veut avoir accès au document. Sur place, les usagers disposent d'une grande liberté pour effectuer les déchargements, mais cette liberté confine parfois à l'anarchie et les conséquences techniques de ces accès libres peuvent être redoutables. De plus, pour le son, il serait nécessaire d'équiper tous les postes connectés à Internet avec des casques. En fait, les plus avancés de nos usagers explorent ces nouveautés depuis leurs laboratoires, dans un environnement informatique qui leur est familier. Audio et vidéo sont encore du domaine de l'anecdotique, mais se développent notamment comme supports de formation médicale continue.
Dans le domaine de l'image fixe et animée, l'offre est déjà plus importante. La modélisation moléculaire en particulier est un domaine bien développé dans les laboratoires. Nombre de logiciels existent, et notre fonds d'ouvrages dans ce domaine est largement utilisé. Cette information de type électronique trouve avec Internet un support de transfert idéal. Plusieurs sites spécialisés ont développé des bases dont l'accès est libre, conformément à la tradition de circulation de l'information qui existe dans ce domaine depuis l'origine d'Internet.
Les bases de données, directement accessibles à l'utilisateur terminal et rassemblant des corpus entiers d'informations primaires ou secondaires, sont sans doute l'apport majeur de l'Internet documentaire. Nous établirons plus loin une typologie de l'information utile pour tenter de dégager les principaux axes de recherche sur Internet. Or, pour chacun des principaux types identifiés, on trouve des bases de connaissances organisées qui utilisent les facilités de l'hypertexte pour mettre à la disposition de l'usager toute l'information bibliographique ou factuelle dont il peut avoir besoin.
Les bibliothèques sont des utilisatrices désignées de ce type de produit, et notre serveur Web s'est dans un premier temps développé autour de ces applications devenues indispensables à la fonction documentaire dans un organisme de cette taille : bases de données bibliographiques, catalogue, et bien entendu accès à des périodiques en ligne. En 1998, ces trois éléments, auxquels il faut ajouter la fourniture de documents, constituaient 100 % des services consultés en priorité par les utilisateurs internes du serveur (bases : 38 %, catalogue : 28 %, journaux : 22 %, commande de documents : 12 %).
Ces applications font du serveur un lieu privilégié d'entrée sur Internet pour les usagers, et parfois même leur premier lieu d'accès au Web. Il doit donc répondre à des attentes d'orientation, voire de formation. C'est un des principaux objectifs que nous nous sommes fixés. Dans cette optique, nous avons constitué notre propre guide de recherche, ce qui nous a permis de l'adapter aux besoins locaux et d'exploiter des observations personnelles sur l'organisation de l'information. Parallèlement, ce guide sert de base à une formation d'une demi-journée régulièrement proposée à nos usagers.
Afin de dégager des axes méthodologiques de recherche d'information, il nous a semblé pratique de la catégoriser tant que faire se peut. Le but étant de présenter des serveurs spécialisés soit dans la diffusion, soit dans le repérage de tel ou tel type d'information. Ces catégories larges ne permettent pas de rassembler toutes les ressources possibles, mais elles doivent poser les bases d'une bibliothèque personnelle constituée des sites indispensables à l'exploration d'un domaine. Elles mélangent des thèmes, des sources et des types de documents, ce qui permet également, en multipliant les entrées, de « quadriller en quelque sorte l'espace virtuel.
Information bibliographique, médicaments, médecine vétérinaire, sites institutionnels, congrès, brevets et normes, périodiques, formation médicale continue... La liste n'est guère plus longue, mais à l'expérience bien peu de documents utiles échappent à ces quelques axes. En préalable, ceuxci sont complétés par des outils de recherche, eux-mêmes spécialisés si possible.
Si l'ensemble répond assez bien à des exigences documentaires professionnelles, son utilisation par un scientifique nécessite une démarche particulière - avec des objectifs d'apprentissage, éventuellement des projets de veille - qui n'est pas toujours possible. Soit on ignore les possibilités du support, soit on ne dispose pas du temps nécessaire. Il nous a donc paru que, pour fidéliser nos lecteurs et apporter une réelle plus-value au site, il fallait créer ce que l'on pourrait appeler des produits d'appel, condensés d'information organisés autour d'une thématique et directement utilisables.
Ainsi sont nées des listes de liens vers des sites de périodiques scientifiques, des sites d'éditeurs ou encore des livres en ligne. Des guides pratiques sur l'utilisation de bases de données (Science citation index, Medline, Current contents) ou de logiciels (Endnote) complètent ces parties " utiles et une rubrique hebdomadaire présente des sites d'intérêt documentaire. L'intérêt de l'usager doit être entretenu.
Bien entendu, tous ces produits sont consultables en Extranet et contribuent à augmenter l'audience du site et par conséquent la renommée de la bibliothèque. La constitution d'un tel corpus de sites s'accompagne d'un travail de veille régulier afin d'effectuer les mises à jour. Plusieurs services travaillent à présent en partie avec le serveur Web, et les avancements réalisés prennent systématiquement ce support en compte : la formation avec des développements de support orientés Web, la fourniture de documents avec des formulaires de commande en ligne ou l'utilisation des grands services mondiaux (CISTI, British Library Document Supply Center...).
Les périodiques, supports scientifiques les plus importants, nous permettent de résoudre grâce à leur forme électronique les quatre problématiques évoquées plus haut. Rapidité d'accès à l'information, validité, puisque les produits sont constitués de la même façon que le papier avec leurs comités de lecture, permanence et autonomie des accès pour les chercheurs. Avec plus de 120 titres en texte intégral, nous suivons avec intérêt l'évolution des offres, déjà largement étudiée par ailleurs (2) .
Internet a déjà remporté la bataille du support : quelques tentatives de diffusion sur cédérom ont rapidement été abandonnées (Biochemistry on CD-Rom, 19961997) : les problèmes de diffusion étaient semblables à ceux du papier, et les manipulations contraignantes. Seul le stockage était partiellement favorable par rapport au produit strictement en ligne, ce qui reste le problème majeur de ce support. Un essai à plus grande échelle a été réalisé avec Ovid et la Core biomédical collection 2, bouquet de quinze revues en texte intégral. Service intéressant puisqu'il proposait l'accès réseau avec des liens depuis Medline, également sous Ovid. Mais son défaut majeur, en dehors de thématiques inadaptées (trop cliniques), est de présenter uniquement le format HTML, peu prisé par les usagers qui souhaitent systématiquement imprimer les articles.
Également testé, journals@ovid, malgré un élargissement de ses collections qui couvrent aujourd'hui de larges pans de la recherche fondamentale biomédicale, présente le même handicap majeur de ne proposer que le format HTML. La question du format est à ce point essentielle que l'éditeur Cell Press a été obligé d'accorder l'accès sans surcoût au PDF pour quatre de ses revues sous la pression de ses abonnés, alors que le tarif initial ne comportait que du HTML. Les solutions d'accès direct en ligne semblent donc avoir emporté l'adhésion du public.
L'interfaçage avec la base de données en ligne Medline (PubMed) permet, pour certaines revues, d'effectuer des recherches bibliographiques et d'accéder au document dans la continuité.
Les études sur l'utilisation d'Internet sont encore peu nombreuses, particulièrement dans des cadres équivalant à celui de notre bibliothèque (3) . L'Institut Pasteur a bénéficié dès le départ d'une situation favorable au développement des pratiques de recherche sur Internet : un Web Pasteur existe depuis 1993, et plus de 2 400 personnes possèdent une autorisation d'accès. En 1996, le service d'informatique scientifique établissait que les logiciels réseau les plus utilisés concernaient la messagerie électronique (la quasi-totalité des utilisateurs), suivis des logiciels de recherche bibliographique, encore assez loin devant les outils d'analyse de séquence.
À l'enquête locale de 1998, 70 % des pasteuriens répondants déclarent utiliser notre serveur Web. Un logiciel de statistique sur la fréquentation de nos pages nous permet d'établir que la seule page d'accueil du site bénéficie de plus de 2 000 connexions hebdomadaires, et les parties du site décrites ci-dessus de plus de 6 000, hors la consultation du catalogue et des bases de données bibliographiques.
Une telle audience dépasse largement le cadre de l'Institut Pasteur : les requêtes émanent de toute la France, avec un grand intérêt des autres organismes scientifiques (INRA, CNRS, INSERM, IRD...), de l'Europe et au-delà. La coopération documentaire s'éveille, et permet déjà d'assister les Instituts Pasteur du réseau international en leur donnant accès à nos bases bibliographiques et à notre service de fourniture de documents.
Pourtant, nous avons chaque jour l'occasion de présenter en salle de lecture l'un ou l'autre de nos services en ligne : une large part des usagers potentiels reste donc à conquérir. Ce que montrent ces résultats encourageants, c'est que l'effet Internet sur les usages documentaires ne concerne probablement pas seulement un changement de support. Par ses facilités d'accès, ses énormes potentialités informatives, il a sans doute aussi permis de drainer tout un public nouveau jusqu'à notre bibliothèque, physiquement aussi bien que virtuellement.