Index des revues

  • Index des revues

La description et la recherche des documents électroniques

1997
    ⇓  Autres articles dans la même rubrique  ⇓

    La description et la recherche des documents électroniques

    Par Sandie Beaney
    Par Leona Carpenter, British Library

    (1) (2) La proportion des documents des collections des bibliothèques qui à l'avenir seront stockés ou rendus disponibles sous forme numérique, est sujet à débat, voire à controverse. Quelle que soit cette proportion, il est évident que les bibliothécaires doivent déjà faire face aux défis posés par le nombre croissant (en termes absolus) de publications électroniques et autres documents similaires, comme les documents numériques. Les usagers s'attendent à trouver, dans nos collections, ce type de documents, dont ils ont besoin pour leurs recherches. Il faut donc les prendre en compte dans les acquisitions, le développement et la gestion des collections.

    Beaucoup de vieux universitaires ont été initiés à l'emploi des ordinateurs du fait de la nécessité d'apprendre à utiliser les catalogues en lignes (OPAC) dans les années 1980. Aussi ne devrions nous pas être surpris que dans les années 1990, certains professeurs pensent que les bibliothécaires useront de la baguette magique de la technologie pour répondre à leurs besoins.

    Ce que nos utilisateurs ne sauront pas, c'est que notre plus grand défi pour leur fournir les services dont ils ont besoin ne réside pas dans la technologie, mais dans l'effort intellectuel demandé pour rendre cette technologie utile, dans les ressources nécessaires pour fournir de nouveaux services électroniques, tout en continuant à assurer les services traditionnels au moment où les bibliothèques doivent faire face à de sévères restrictions budgétaires ; et dans la nécessité de coopérer au niveau international pour définir les normes qui assurent la qualité de ces services. La British Library (BL) fait activement face à ces défis par les travaux de l'Electronic Media Group et le programme Initiatives for Access.

    Le service Acquisition Processing and Cataloging (AP&C) a mis en place l'Electronic Media Group et son projet de catalogage des médias électroniques pour développer un centre d'expertise au sein de la bibliothèque pour cataloguer des publications électroniques, participer - au niveau international - au développement de normes internationales et assurer la diffusion des connaissances en matière de documents électroniques à l'intérieur de la bibliothèque et plus largement dans la communauté des bibliothèques.

    Au sein de l'Initiatives for Access Programme, des projets individuels ont exploré l'indexation, les méthodes et les besoins pour accéder aux documents. Dans certains cas, cela a impliqué l'expérimentation de nouveaux logiciels d'accès et la recherche de nouveaux moyens pour mettre d'anciens catalogues à la disposition de chercheurs.

    Normes

    Le catalogage et la recherche efficaces de documents numériques reposent dans une grande mesure sur l'application de normes, et à la BL le service de catalogage travaille selon les normes internationalement reconnues.

    Les développements technologiques ont entraîné des changements qui nous ont obligé à revoir rapidement la manière dont nous appréhendons le catalogage des ressources numériques ; une partie de nos investigations a porté sur les sujets suivants.

    Premièrement, il y a une tendance croissante à la coopération dans l'utilisation de bases de données d'information bibliographique pour tout type de matériaux, et l'accroissement des ressources numériques a accru l'intérêt pour le partage, ou au moins pour permettre l'accès à la fois à des ressources et des services qui leur sont associés. En tant que bibliothèque nationale, la BL non seulement a des collections qui, à l'avenir, comprendront des documents électroniques, mais a aussi une responsabilité pour fournir l'accès via des catalogues et des services associés à ces ressources. En raison de son engagement à appliquer les normes, la Bibliothèque est concernée par l'élaboration des normes. Son implication dans le débat sur les normes de conversion et les besoins d'harmonisation des normes de catalogage est essentiel.

    Deuxièmement, l'évaluation de l'utilité et de l'adéquation des normes traditionnelles, dans leur application aux ressources électroniques, fait partie du processus de coopération. L'engagement dans le processus d'harmonisation offre l'opportunité de revoir certains aspects des pratiques et de la politique de catalogage, de réexaminer pourquoi nous faisons ce que nous faisons et comment on peut l'appliquer aux ressources électroniques.

    Troisièmement, la nature des ressources change. Les caractéristiques d'un document électronique disponible sur Internet ne sont pas aussi faciles à définir que celles d'autres documents tels qu'un livre imprimé, ou même un cédérom qui contient une information numérique dont les caractéristiques figurent sur le support physique. En ce qui concerne les ressources Internet, différents types d'information dans l'enregistrement bibliographique prennent une nouvelle importance. Si le catalogage de certaines ressources Internet devient une pratique de la bibliothèque, fournir le chemin d'accès à un document électronique, c'est faire comme si elle détenait les documents. Cela a des implications pour la qualité du catalogue, dans la mesure où la localisation de nombreuses ressources change et où d'autres disparaissent d'Internet. C'est comme si dans une bibliothèque traditionnelle, les personnes chargées de la maintenance des catalogues n'étaient pas informées des retraits d'ouvrages des collections et des changements de cote.

    Les mentions d'éditions posent d'autres problèmes dans la mesure où celui-ci peut être profondément modifié au fil du temps.

    Différents domaines d'intérêt et d'implication relèvent des attributions du projet de catalogage des documents électroniques.

    L'Electronic Media Group a beaucoup travaillé à la révision de la norme internationale de description bibliographique des documents informatiques, en tant que membre du groupe de révision de l'ISBD (CF). La révision est en voie d'achèvement dans la mesure où le nom a été changé pour redéfinir son objet. Elle concerne maintenant les « ressources électroniques » et est ainsi devenue l'ISBD (ER). La terminologie a été modifiée pour tenir compte de l'évaluation technologique (3) .

    Le Projet de catalogage Internet d'OCLC est en cours depuis quelque temps maintenant, et l'Electronic Media Group a coordonné les échanges entre les personnes impliquées dans le projet (4) . Bien que le projet se termine officiellement, la base de données est maintenue et la liste de discussion offre un forum valable pour le débat sur l'application des normes traditionnelles aux documents. En outre, le débat sur l'utilisation des URL (adresses de sites et documents) et de PURL (Persistent Uniform Resource Locators) est d'un intérêt particulier pour la maintenance des chemins d'accès et de la localisation et la recherche de documents électroniques. Les PURL sont des URL qui pointent vers un service intermédiaire. Le resolver associe le PURL avec un URL spécifique, retourne l'URL correcte au browser et ouvre le document comme dans n'importe quel standard de réorientation. Cela accroît la stabilité d'Internet car les liens utilisant les PURL restent valides permettant ainsi de garder l'intégrité du catalogue.

    La participation de la BL à l'harmonisation des formats MARC a aussi eu des implications pour le catalogage des ressources électroniques. Comme de nouveaux types de documents se développent, de nouveaux champs MARC sont nécessaires pour s'y conformer, et naturellement une application uniforme de ces nouveaux champs serait souhaitable. Des recommandations ont été faites pour l'adoption des champs MARC par le format UKMARC qui permettrait de s'adapter aux ressources Internet. Bien sûr la BL bénéficierait d'une cohérence et une efficacité maximum en ce qui concerne ses collections, y compris les documents numériques. Un grand niveau d'intégrité du catalogue serait nécessaire, la Bibliothèque a un grand intérêt à s'impliquer dans le développement des normes des documents numériques.

    Catalogues numériques

    Deux types distincts de questions relatives aux documents numériques se rapportant à l'indexation et à la recherche existent dans la Bibliothèque, et dans certains domaines, ils sont convergents. L'un concerne la manière dont on aborde les collections numériques, mais nous allons y revenir; l'autre concerne la manière dont la technologie numérique permet l'accès à toute une variété de médias disponibles à la Bibliothèque.

    Les catalogues informatisés existent depuis quelque temps maintenant, comme partie du processus de catalogage; beaucoup d'entre eux utilisent le format MARC. Bien qu'ils offrent un plus grand éventail de possibilités de recherches que les catalogues sur fiches traditionnels, permettent l'accès à un plus grand nombre de données de l'enregistrement, l'information bibliographique est toujours définie en utilisant les normes de catalogage anglo-américaines, 2° éd. 1987 rev. (AACR2r). De nouveaux développements comme le logiciel Excalibur Filing System (EFS) sont utilisés à titre expérimental.

    Les catalogues numériques offrent d'énormes possibilités pour le catalogage des documents électroniques et traditionnels. En plus de grands bénéfices en matière de recherche, les catalogues numériques offrent de nouvelles avancées au niveau de l'enregistrement. Actuellement, à la BL, la plupart des enregistrements sont stockés et peuvent être fournis au format AACR2r/MARC, mais comme la technologie change, il viendra un temps où...

    • les pages de sommaire apparaîtront comme des graphiques liés à l'enregistrement ;
    • la couverture ou la jaquette seront rattachées à la notice ;
    • les images clés associées aux documents pourront être affichées ;
    • les représentations graphiques ou audio des principaux thèmes mélodiques d'une musique pourront être rendues accessibles.

    Améliorer l'information dans le catalogue signifie que le temps gagné par l'usager est plus efficacement dépensé. La fourniture d'informations pertinentes additionnelles dans une notice améliore les services rendus par le catalogue de la manière suivante.

    • » Une page écran de sommaire peut dire beaucoup plus sur un document que le titre seul, ou même que des vedettes sujets. Indexer les sommaires fournit des points d'accès supplémentaires, et même s'ils ne sont pas indexés et que la notice est appelée par d'autres moyens, l'information supplémentaire aide l'usager à faire son choix.
    • » La couverture d'un livre, d'un cédérom, peut aider l'usager à identifier un document comme quelque chose qu'il a déjà vu ou dont il se souvient. N'importe qui ayant travaillé dans une salle de lecture ou un bureau d'information reconnaîtra la valeur de ceci. Il serait difficile, et peut-être pas très utile, d'indexer la couverture, mais sa présence comme partie de l'enregistrement est valable comme élément d'identification.
    • * Les images principales relatives à un texte seront plus vraisemblablement indexées si elles sont bien connues comme partie du document catalogué ; cela se vérifiera, par exemple, pour les illustrations d'oeuvres d'art et serait particulièrement valable pour les catalogues d'exposition. Elles peuvent aider à clarifier le contenu d'une oeuvre.
    • * Les graphiques et les clips audio d'un enregistrement musical illustrant les thèmes clés d'une oeuvre peuvent être particulièrement utiles pour les usagers qui ne sont pas sûrs si l'air qu'ils ont en tête est bien celui de l'oeuvre du catalogue. Autrement dit, cela offre la confirmation visuelle du fait qu'ils veulent vraiment cette oeuvre. La technologie pour cela n'est pas encore très répandue, et est sans doute hors de portée des moyens de la plupart des bibliothèques. Cependant, la perspective de pouvoir éventuellement taper les rythmes ou les mélodies décrites ou même de chanter à votre ordinateur pour faire votre recherche élargirait énormément la portée des enregistrements des catalogues traditionnels.

    Catalogage des publications numériques et collections de documents numérisés

    (5) La portée de l'utilisation d'un catalogue est encore étendue quand les collections cataloguées sont elles-mêmes numérisées. Les documents numériques sont une nouvelle sorte de défi, car ils nécessitent matériels et logiciels spécifiques. Ils ont leur propre terminologie pour des concepts existant depuis longtemps ; le terme metadata (métadonnées) en est un premier exemple.

    Dans le monde des sciences de l'information, ce terme fait référence à ce qui est essentiellement l'enregistrement bibliographique et aux outils d'indexation qui lui sont associés, mais il peut aussi faire référence à un TEI (Text Encoding Initiative) ou à n'importe quel type de description. L'un des avantages des documents électroniques est que les metadata peuvent être encodées dans la notice plutôt qu'exister comme une entité séparée. Les enregistrements du catalogue dérivent directement du document si les metadata encodées en sont extraites. Le catalogueur est alors libre de consacrer davantage de temps à la classification ou à d'autres activités, comme faire des résumés, et moins de temps à construire les champs de base. Cela pose certains problèmes parmi lesquels le contrôle de qui encode quoi dans un document.

    Le «Dublin Core» était le résultat d'un groupe de travail qui avait pour but d'établir les directives minimales pour que les auteurs de documents électroniques encodent eux-mêmes leurs oeuvres. Les directives doivent fournir une aide pour ce qu'elles définissent comme des metadata sans syntaxe pour des objets-documents ». Des progrès ont été réalisés depuis ce premier séminaire et les principes ont été adoptés ou adaptés par de nombreuses organisations. Si la bibliothèque venait à cataloguer des ressources disponibles sur Internet à relativement grande échelle, les métadonnées encodées aideraient considérablement le processus de description.

    Il devient plus fréquent de voir les liens directs entre l'OPAC et les documents électroniques. Diverses institutions ont fait des catalogues en format HTML (hypertext mark-up language) permettant à l'usager de cliquer sur l'affichage à l'OPAC pour accéder au document concerné. Le projet CATRIONA (Cataloguing and Retrieval of Information Over Networks Applications) a été financé en partie par une bourse de recherche de la BL et fonctionne sur la base de la recherche en réseau de metadata pour les ressources d'Internet. Les catalogues locaux doivent contenir les ressources locales usuelles, ainsi que les ressources électroniques utiles à l'institution et les OPAC extérieurs de différents sites. Localiser un enregistrement USMARC contenant un champ sujet 856 permet à la station de travail de charger automatiquement le browser correct et de chercher et d'afficher le document sur le poste de l'usager.

    Les nouveaux logiciels d'accès

    D'autres approches de la recherche de documents numériques sont possibles grâce à l'utilisation de nouveaux logiciels d'accès, qui devraient être plus ou moins intégrés aux catalogues en ligne. Les raisons pour utiliser ces nouvelles approches sont l'amélioration de l'accès, la réduction des coûts d'accès ou les deux. Nous avons résisté à la tentation d'utiliser la technologie simplement parce qu'elle existe, interdisant même des expériences d'initiatives pour l'accès pour les besoins du service.

    Les idées sur l'utilité des technologies de pointe peuvent venir des équipes informatiques, qui ont la responsabilité de l'expertise dans ce domaine, mais de telles idées peuvent être mises en pratique seulement si elles sont soutenues par le personnel autre que les spécialistes de l'informatique. Nous avons trouvé des moyens d'améliorer l'accès aux collections sans avoir à supporter les coûts de l'effort intellectuel de l'indexation du contenu qui y sont généralement associés ainsi que des moyens pour fournir des possibilités de recherche impossibles sans l'utilisation des nouveaux logiciels. Cependant, toutes les solutions n'offrent pas ces deux avantages.

    Les spécialistes de l'informatique qui ont attiré l'attention des bibliothécaires sur les possibilités de l'Excalibur Electronic Filing System (EFS) y pensaient d'abord comme à une façon de permettre d'accéder aux imprimés anciens fragiles. Anciens journaux, pamphlets, éphémérides sont coûteux à indexer dans une base sommaire, et pour des raisons de préservation doivent être protégés d'une manipulation trop fréquente. L'accès à ce type de documents est souvent restreint aux versions sur microfiches ou microfilms, formes que les chercheurs trouvent désagréables ou du moins peu commodes à consulter, et qui peuvent être décrits au niveau du volume seulement, avec des accès par sujets limités. Avec EFS, ces documents peuvent être numérisés soit à partir de l'édition originale, soit à partir de photographies ou de microfiches, soit même à partir de bonnes photocopies, et les images qui en résultent sont converties en texte identifiable par la machine grâce à la reconnaissance optique de caractères. Une base de données permet l'ajout d'éléments qui peuvent ne pas apparaître dans le texte, tels que le titre de la publication, l'éditeur ou la date de publication. Il n'y a là rien de neuf.

    La nouveauté et la puissance de l'EFS résident dans ce que l'on fera ensuite avec les fichiers d'images et de textes qui ont été ainsi créés. Excalibur's Adaptive Pattern Recognition Processing (APRP) est utilisé pour créer des résultats de recherches très pertinents et des fichiers index très compacts. Un élément important de l'APRP est qu'il se rapproche de la recherche en langage naturel avec un haut degré de tolérance pour les fautes de frappe, d'orthographe, faites dans le texte original et les variantes orthographiques selon les époques et les régions linguistiques. Le résultat de la recherche fournit un accès direct aux images du document qui peuvent être affichées sur le poste de travail du chercheur telles qu'elles apparaissent sur la page imprimée, y compris les éléments graphiques (caractères étrangers, images, diagrammes, notes autographes) qui ne sont pas maniables pour la conversion par OCR. Depuis que la Bibliothèque a commencé des essais avec EFS, Excalibur a ajouté des liaisons sémantiques, une facilité qui, plus tard, devrait augmenter la capacité de recherche. Les réseaux sémantiques utilisent de multiples thésaurus pour permettre la recherche par analogie. Cette idée courait depuis quelques années, mais n'avait pu être implantée avec succès en dehors de domaines thématiques très limités. Les bibliothécaires ont rapidement réalisé que EFS pouvait être utilisé pour rendre des catalogues imprimés accessibles en ligne et permettre des recherches qui étaient impossibles dans les volumes imprimés.

    Plusieurs centaines de collections spécialisées, de catalogues et d'aides à la recherche sont utilisés à la BL. La plupart ont été créés avant que la loi de 1972 ait regroupé un certain nombre d'organisations qui étaient indépendantes pour former la BL, et avant l'ère des bases de données bibliographiques utilisant les normes AACR et stockées en format MARC Elles reflètent des différences dans les politiques de catalogage et d'indexation des différentes organisations à des périodes historiques diverses et, dans de nombreux cas, les excentricités intellectuelles des élèves de Keepers qui ont consacré leurs années professionnelles à les créer. Leur nombre et leur absence de normes en font un cauchemar pour les responsables des catalogues. Les moyens pour convertir ces catalogues dans les formats AACR2r-MARC afin de les ajouter au catalogue en ligne ne sont simplement pas disponibles. Parmi ceux-ci on trouve le Catalogue of Seals et le Catalogue of Manuscript Music qui ont été entièrement numérisés et chargés dans l'EFS pour être testés par l'équipe. Les informations non données dans les très riches entrées du Catalogue of Seals peuvent maintenant être utilisées comme points d'accès, y compris les éléments iconographiques et les éléments physiques des sceaux.

    Les trois volumes du Catalogue of Manuscript Music contiennent des enregistrements de musique sacrée, chorale et instrumentale des collections manuscrites de la BL, sans références croisées entre les volumes. Un lot de références qui aurait nécessité des heures de recherches pénibles, page par page, volume par volume, peuvent maintenant être rassemblées en quelques minutes par un membre de l'équipe formé à l'utilisation de l'EFS. Des développements ultérieurs seront nécessaires pour obtenir une interface de recherche qui puisse être utilisée par des chercheurs sans formation spéciale, ou pour incorporer la recherche dans les catalogues tenus en EFS et dans l'OPAC de la Bibliothèque.

    L'EFS a été utilisé par d'autres organisations pour chercher des données numérisées non textuelles, telles que les empreintes digitales et les photographies. Ce sont des applications faites sur commande, notamment dans le domaine médico-légal où les thèmes de recherche peuvent être prévus avec un haut degré de réussite. Ainsi les critères de recherche pour la base de données d'empreintes digitales prises sur le lieu du crime, des armes, des objets volés, des suspects et des détenus, seront toujours une autre empreinte prise sur le lieu du crime, une arme ou un objet volé, un suspect ou un détenu. Et le critère de recherche pour une base de données de photo d'identité sera une autre photo, un dessin fait par un artiste légiste, un portrait robot. Le degré de ressemblance, d'approximation permis pour faire concorder le critère de recherche avec le contenu de la base de données peut être ajusté pour accroître ou décroître la taille du lot de suspects potentiels et il a, par exemple, été possible d'identifier correctement une personne même si l'image d'entrée était celle d'un barbu et pas celle d'une personne imberbe. Les experts des empreintes digitales humaines et les témoins peuvent être libérés de beaucoup de travail en diminuant le nombre d'images à étudier. Il est difficile de voir comment le type de recherche peut être appliqué aux images dans les collections d'une bibliothèque où les critères de recherche sont beaucoup plus hétérogènes, beaucoup plus difficiles à prévoir, et où il n'y a pas une seule source répondant à la demande.

    Il existe des difficultés similaires avec d'autres expériences de recherche qui permettent de chercher selon des critères comme la forme ou les couleurs sélectionnées dans un éventail proposé à l'écran. Il est facile d'imaginer l'utilité de ces possibilités, par exemple, dans un catalogue de mobilier. Pour les savants et les chercheurs d'images, les usagers types des collections d'images de la BL, de tels systèmes, en leur état actuel de développement, seraient trop lourds à utiliser et peu capables de fournir les points d'accès pertinents pour leurs recherches pour que cela vaille la peine de les utiliser.

    Il est possible de renforcer l'accès aux collections d'images avec des logiciels plus établis, bien que relativement récents. Des solutions comme les systèmes de visionnages électroniques des photos ont l'avantage d'un système beaucoup plus puissant que n'importe quel système informatique existant dans la bibliothèque : human cognitive system (système de cognition humain). Imaginez comment dans une pièce pleine de monde, avec le bruit de nombreuses conversations et alors que vous-même êtes engagé dans une conversation, vous entendrez soudain votre nom ou quelques mots se rapportant à un autre sujet émergeant de l'arrière-fond bruyant, comme s'il avait été amplifié. Ou comment dans une rue peuplée, vous repérez soudain un ami marchant devant vous alors que vous n'étiez pas conscient des personnes qui vous entouraient. Cette qualité de l'attention humaine peut être utilisée pour localiser l'image appropriée dans une collection numérisée. 24 images peuvent être affichées sur un bon écran de 70 pouces, offrant la dimension et des détails adéquats pour faire une première sélection. Les chercheurs d'images expérimentés peuvent feuilleter ces pages d'écran aussi vite qu'ils peuvent cliquer sur « écran suivant s'arrêtant seulement pour mieux regarder une image qui attire leur attention. Comme dans une pièce ou une rue peuplée, la cognition humaine ne nécessite pas qu'ils fixent leur attention sur chaque élément. Leur attention sera plutôt instinctivement attirée par une image qui, d'une certaine façon, répond à leurs besoins. De cette manière, ils peuvent chercher parmi des centaines d'images en quelques minutes, puis passer davantage de temps à examiner celles qu'ils ont sélectionnées. Cela est une bonne solution au problème de l'indexation par écrit des images dans la mesure où un langage d'indexation facile à utiliser n'est pas capable de répondre à la diversité des besoins des chercheurs et de prévoir la variété des thèmes de recherche, et où un système d'indexation par mot clé est très coûteux à mettre en place, alors qu'ils n'offriraient pas un bon niveau de compatibilité avec les termes offerts. L'indexation des documents peut être limitée à l'ajout d'informations relatives à la date, à la localisation et à l'identification du document, bien qu'une indexation grâce à un thésaurus soit souhaitable si on en a les moyens. L'utilisation de termes de recherche permet de réduire la première sélection, par exemple des photographies canadiennes antérieures à 1915 représentant une femme portant un bébé.

    Le multimédia interactif offre des solutions complètement différentes de celles de l'EFS qui élimine, ou tout au moins réduit, au minimum l'indexation qui doit être faite par les bibliothécaires. Electronic Beowulf est un exemple de l'amélioration de l'accès, grâce à un nouveau logiciel qui demande un gros effort de la part des conservateurs pour être mis en place. De plus, il contient des images du manuscrit de la qualité d'un fac-similé, la possibilité d'y adjoindre, sur un fichier virtuel d'un écran d'ordinateur, les transcriptions de différentes périodes et personnes et des images de comparaison avec d'autres manuscrits de la même époque. Le manuscrit peut être manipulé de différentes façons telles que la redisposition de la collation, l'amélioration de la qualité de l'image de caractères obscurs. Tout savant utilisant «cette édition électronique avec un équipement savant trouvera son chemin dans ces manuscrits et tous les documents d'accompagnement, en prenant sans doute un itinéraire différent à chaque fois. Mais ces voyages sont possibles seulement parce que le travail fait par les universitaires qui étaient là avant eux créant des chemins d'accès, établissant des passerelles entre les manuscrits, les transcriptions, les textes redécouverts, les matériaux annexes, améliorant l'image de parties de textes interprétées de manières différentes ou posant d'autres problèmes, etc. Ce type de possibilités d'accès élargit notre définition de l'indexation et il y a relativement peu de collections, ou de sujets de collection, qui justifient l'utilisation de ressources pour y parvenir. Les critères de sélection doivent inclure l'intérêt scientifique, l'importance culturelle, le caractère unique, la distribution géographique de certains documents et des collections cohérentes, et un grand intérêt général. Ce dernier est particulièrement intéressant, car des éditions électroniques populaires basées sur des éditions savantes peuvent capter l'attention d'un public plus grand, entraînant les gens dans une meilleure appréciation de notre héritage culturel.

    Choix et développement de logiciels

    Les bibliothécaires étudiant l'application de nouvelles solutions d'accès doivent choisir entre développer leur propre logiciel (« faites-le vous-même »), passer commande à un fournisseur ou acheter un logiciel existant déjà sur le marché. Chaque solution présente des avantages et des inconvénients. L'expérience à la BL permet de donner quelques indications sur les questions à examiner lors du choix.

    Alors que la commande d'un logiciel coûte plus cher que l'achat d'un logiciel existant, c'est moins cher que de le faire soi-même, en théorie, et vous obtenez ce que vous voulez, encore une fois en théorie. Dans la pratique, le coût et la livraison des fonctionnalités désirées peuvent être tout aussi difficiles, si ce n'est plus, à contrôler, que quand le système est développé par votre équipe. Le coût de la maintenance d'un logiciel de commande doit être aussi considéré. La maintenance et le support par le fournisseur doivent être négociés au moment de la passation du contrat. Vous devez prendre en compte la confiance que vous pouvez faire au fournisseur quant à son maintien dans les affaires, afin de vous apporter l'aide dont vous aurez besoin. Si le système doit être maintenu et supporté par votre propre équipe, vous devez vous assurer que la documentation et la formation nécessaires sont prévues dans le développement, la mise en place du logiciel. Une documentation totale est nécessaire, que la maintenance soit assurée, par qui que ce soit. Nombreux sont ceux qui sont appelés à développer des systèmes, mais peu ont les documentations. Nous recommandons que la demande de fourniture de la documentation d'un système standard soit inscrite dans le contrat de fourniture d'un logiciel commandé, avec la stipulation claire que le système ne sera pas considéré comme complet et que le paiement final ne sera pas fait tant que cette condition ne sera pas remplie.

    On peut souvent trouver de bons compromis entre des logiciels de commande et des logiciels clé en mains. Un système existant peut être adapté aux besoins spécifiques d'une bibliothèque. Dans ce cas, les questions à se poser sont les suivantes:

    • quelle est l'ampleur du compromis ? Est-ce que l'on peut aller un peu plus en avant et ne rien changer au système ? Les changements demandés sont-ils si importants que vous devez payer tout aussi bien un nouveau développement ?
    • votre version sera-t-elle tellement différente de la standard qu'elle sera difficile à maintenir et nécessitera sa propre documentation ?
    • le fournisseur est-il vraiment concerné par votre secteur d'activité ? ou bien vous voit-il comme un client unique mais utile ?

    Nous nous sommes posé ces questions quand nous avons choisi I-Base pour le système Photo Viewing System. En particulier, nous nous sommes inquiétés du fait que la compagnie, dont l'activité principale est l'imagerie médicale, ne consacre pas suffisamment de ressources à poursuivre le maintien d'un système qui allait devenir essentiel dans le cadre du développement de nos services. Cependant, ils ont su nous montrer leur intérêt pour le secteur des bibliothèques, des musées, des archives, entrant en relation avec d'autres clients qui avaient des demandes similaires aux nôtres.

    Regard vers le futur

    Il est vraisemblable que la BL devra bientôt faire face à une augmentation des documents numériques, comme le débat sur le dépôt légal se poursuit et, en conséquence, elle aura la responsabilité de leur contrôle bibliographique et de leur mise à disposition. Avec l'obligation de permettre dans une certaine mesure l'accès public, la bibliothèque devra répondre à certaines questions concernant l'accès à ces documents. Les directions Acquisitions Processing et Cataloging reçoivent, à titre expérimental, des journaux électroniques pour catalogage et espèrent pouvoir établir les procédures nécessaires pour faire face à ce type de dépôt. Les salles de lecture offrent l'accès à des cédéroms de référence mais ils sont à l'écart dans d'autres collections de la bibliothèque et non sur des postes de travail qui permettraient le lien direct avec l'OPAC. L'idéal serait d'avoir certains postes de travail dans les salles de lecture qui permettraient le lien direct entre le catalogue et les cédéroms en réseau. Le choix des documents en réseau sera une autre question, car il n'est pas possible de tout mettre en réseau, et les licences ne le permettent pas forcément.

    La Bibliothèque est avant tout concernée pour le moment par le dépôt légal, et donc par le catalogage des documents électroniques ayant un support physique. Cependant, les propres productions de la bibliothèque sur Internet ou les coproductions seront des " candidats évidents pour la création d'enregistrements contenant les liens HTML du document sur Internet ou sur Intranet. Les projets tels que Electronic Beowulf répondront à ces critères. Cependant, ils devront aussi être fournis pour les journaux électroniques auxquels le Document Supply Center est abonné.

    En ce qui concerne le dépôt légal, un certain nombre de questions doivent être examinées. Les normes de catalogage utilisées par la Bibliothèque étaient à l'origine destinées à la description de différentes sortes de médias, même si certaines concernaient les fichiers informatiques. Cela ne veut pas dire que les normes citées, comme AACR2r, sont maintenant redondantes, mais cela signifie que l'heure est venue de les mettre à jour. En outre, les nouveaux boîtiers rendent nécessaire la mise à jour de la liste des matériaux spécifiques. La notice bibliographique doit être suffisamment informative pour l'usager du catalogue.

    À la lumière des révisions de l'ISBD (ER), les normes AACR2r doivent inclure certains de ces changements. Une révision beaucoup plus en profondeur des concepts fondamentaux du catalogage a été suggérée. Michael Heaney de la Bodleian Library a écrit un article sur le catalogage orienté objet, comme direction possible pour la création d'enregistrement. Cela signifie-t-il une version des AACR? La version 3 actuelle AACR2r est orientée vers des technologies plus anciennes, et il n'est pas toujours facile d'appliquer ces normes à de nouveaux types de documents. Cependant, beaucoup de problèmes sont plus pratiques que théoriques.

    Les problèmes généraux qui se posent incluent des questions de base comme le repérage de la source principale d'information. La facilité d'accès à une page de titre contraste avec l'obligation d'installer un cédérom sur un ordinateur, avec ou sans logiciels d'installation, pour arriver au même but. Cela peut s'accompagner de problèmes internes spécifiques comme l'existence de virus et devoir reti-rer le document du micro lorsqu'il a étécatalogué. Dans le passé, cela a conduit àl'effacement de certains fichiers, plutôtimportants pour l'accès à Microsoft. Deslogiciels existent qui gèrent efficacementces procédures, mais ils ne sont pas suffi-samment fiables pour résoudre tous cesproblèmes et leur utilisation est trop coû-teuse en temps pour le catalogueur.Cependant, avec le dépôt légal, la Biblio-thèque pourrait espérer de plus grandesquantités de cédéroms communs quifonctionnent sur le principe plug andplay", sans beaucoup de procéduresd'installation spéciales.

    Comme les médias changent, les catalogueurs peuvent être confrontés à des objets ressemblant à des documents qui demandent des normes de catalogage très différentes de celles utilisées dans la plupart des bibliothèques et agences bibliographiques. Ceci est particulièrement vrai pour les ressources disponibles sur Internet. Bien que nous n'ayons pas à la British Library la responsabilité du catalogage de quantités significatives de ressources Internet, toutes ces questions sont à l'étude dans différentes organisations et instances. La citation avec laquelle je vais terminer vient du directeur du OCLC Internet Project :

    «Je pense [...] dans l'environnement qui change vite, qu'il n'est pas toujours facile de savoir quelles méthodes de description et d'accès conviennent le mieux aux ressources disponibles sur Internet. On pourrait se demander pourquoi, alors qu 'OCLC demande aux bibliothèques de cataloguer les documents sur Internet, OCLC s'intéresse aussi aux metadata et développe des choses comme le "Dublin Core"? La réponse est la même. Les problèmes et les besoins induits par Internet sont complexes et nécessitent des solutions fortes et à multiples facettes. Alors que nous avons confiance dans les principes de catalogage et les règles fondamentales du format MARC et des normes de catalogage AACR2r, nous sommes tout aussi sûrs que l'expérimentation et les explorations sur différents fronts, dans la mesure où elles semblent fructueuses, offriront les meilleurs fondements sur lesquels baser les modifications des systèmes, des normes et des pratiques des bibliothèques. »

    Cet exposé ne prétend pas offrir des réponses ou fournir une manière sûre de faire les choses. Il exprime cependant le dilemme auquel doit faire face la profession, qui devra décider dans une certaine mesure si une révision complète des concepts et des pratiques de catalogage est nécessaire, ou s'il est possible de mettre à jour indéfiniment les normes AACR2 et MARC et tout cela sans savoir quels nouveaux formats émergeront à l'avenir. De toute façon, la British Library continuera à chercher les meilleurs moyens pour créer des enregistrements et indexations pour la recherche quelle que soit la manière dont le document est stocké, indexé et rendu accessible.

    1. Article publié dans Information, Services & Use. 1996, volume 16, n° 2 et traduit par Claudine Even. retour au texte

    2. Communication présentée à la conférence : Le développement de l'accès électronique aux collections de la Bibliothèque nationale de France et de la British Library (novembre 1996, Paris, BNF). retour au texte

    3. ISBD (ER) : International Standard Bibliographic Description for Electronic Resources. Sera publié en 1997. (N.d.T.) retour au texte

    4. Pour plus d'informations, voir Electronic resources: Selection and bibliographie control », Cataloging and classification quarterly, 1996, volume 22, nos3-4. (N.d.T.) retour au texte

    5. À noter la parution d'une nouvelle revue : "Journal of Internet Cataloging. The International Quarterly of Digital Organization, Classification and Access", Haworth Press, hiver 1996. retour au texte