(1) Le projet européen AUTHOR (janvier 1995 - décembre 1997) est la première tentative de réalisation concrète d'échanges de données d'autorité sur les noms de personnes et les collectivités auteurs entre 5 bibliothèques nationales gérant des fichiers d'autorité automatisés avec des règles de catalogage, des langues et des formats différents.
AUTHOR est né du besoin exprimé par plusieurs agences bibliographiques nationales européennes d'avoir accès en réseau aux fichiers d'autorité existant à l'échelon international pour réutiliser le travail d'identification des auteurs déjà réalisé par d'autres agences.
En effet, le marché international des notices bibliographiques est florissant. Les notices bibliographiques circulant ainsi comportent des points d'accès auteurs, eux-mêmes gérés de plus en plus souvent dans des fichiers d'autorité automatisés (voir encadré). Il paraît donc logique de vouloir réutiliser les données d'autorité auteurs comme on réutilise les données bibliographiques.
Selon les principes du contrôle bibliographique universel, chaque agence bibliographique nationale doit établir la forme d'autorité des noms de ses auteurs nationaux, personnes physiques ou collectivités, et pour les auteurs étrangers, doit réutiliser les formes d'autorité établies par les agences des pays dont ils ressortissent. Ces principes sont difficiles à mettre en application : d'une part parce que toutes les agences ne gèrent pas de fichier d'autorité, et d'autre part parce qu'il est difficile pour une agence donnée d'avoir accès aux fichiers d'autorité gérés par les autres agences. Étudier la faisabilité d'un accès en réseau aux fichiers d'autorité automatisés existant en Europe est le principal objectif d'AUTHOR.
Ce projet s'est inscrit dans le cadre des activités de CoBRA [Computerised Bibliographie Record Actions) qui visent à encourager la participation des bibliothèques nationales européennes aux programmes de recherche et de développement (2) .AUTHOR a été entièrement financé par la Commission européenne et a concerné 7 protagonistes (voir encadré).
Le projet AUTHOR est un prolongement du projet européen de CD-ROM commun à plusieurs bibliothèques nationales pour publier leurs bibliographies nationales officielles (LIBACTi/CDBIB, 1989-1992) qui avait montré la faisabilité d'une coopération internationale en matière d'échanges de données bibliographiques saisies dans des formats différents, selon des règles de catalogage différentes et dans des langues différentes (3) .
Le principal objectif de AUTHOR est de permettre la réutilisation dans le catalogage courant de données d'autorité auteurs produites par différentes bibliothèques nationales. Mais chaque étape du projet a été l'occasion de vérifier la faisabilité technique d'une opération, et on peut décliner ainsi les objectifs.
Plusieurs chantiers ont été lancés en parallèle, mais la présentation qui suit est linéaire pour facilité la compréhension des opérations.
Avec l'assistance technique du cabinet de consultants Bureau Van Dijk, le fichier d'autorité de chaque bibliothèque partenaire a été étudié dans son propre environnement. Chaque fichier d'autorité témoignant de pratiques nationales, l'hétérogénéité de l'ensemble a été vite mise en évidence en ce qui concerne notamment les points suivants.
Par exemple la façon de gérer les vedettes parallèles au sein d'une même notice d'autorité est différente en Belgique et en France. En Belgique, où le fichier d'autorité gère un catalogue bilingue, les vedettes parallèles sont créées pour les formes française et néerlandaise de chaque nom d'auteur. Vedette et notes sont ainsi répétées dans les 2 langues dans une même notice avec un jeu d'indicateurs qui permet d'apparier toutes les données saisies dans une même langue et d'éditer en clair 2 notices d'autorité : une en français et une en néerlandais. En France, les notes sont toujours en français et les vedettes parallèles sont créées lorsque la vedette peut prendre plusieurs formes en terme de langue (ex.: organismes internationaux ayant un nom officiel en plusieurs langues) en terme d'écriture (ex.: les auteurs écrivant en caractères non latins nécessitent la gestion d'une forme translittérée de leur nom), en terme d'usage (ex.: forme courante française et forme savante latine des noms d'auteur du Moyen Âge, etc.). Dans le catalogue géré par le fichier d'autorité, seule la première des vedettes parallèles sert de vedette aux notices bibliographiques, les autres sont gérées comme des formes de renvois.
Par exemple dans certains fichiers, les congrès ou les entités territoriales et les collectivités constituent des types de notices distincts, dans d'autres les familles et les noms de personnes constituent des types de notices différents. Cette distinction, quand elle existe, peut se traduire soit par des étiquettes différentes, soit par un code dans une zone fixe.
D'un fichier à l'autre, les notices sont plus ou moins riches, et d'ailleurs il n'y a pas de consensus international sur le contenu type d'une notice d'autorité. Chaque bibliothèque a défini ce contenu en fonction de ses propres besoins et priorités. Ainsi la nationalité des entités décrites dans les notices d'autorité est rarement mentionnée, et quand elle l'est, elle l'est de façon différente : en zone fixe ou en note.
Selon les types de documents décrits dans les fichiers bibliographiques gérés par les fichiers d'autorité, ces derniers contiennent ou non des notices d'autorité pour les auteurs de tous genres : auteurs de documents imprimés, de manuscrits, de musique enregistrée, de documents cartographiques, etc. Le contenu de chaque fichier témoigne ainsi de pratiques nationales originales.
Cette hétérogénéité des fichiers d'autorité des partenaires a été identifiée dès 1995 dans un rapport d'étape dont il ressortit que le Projet aurait à prendre en compte :
Les partenaires ont alors défini leurs besoins comme suit :
Les partenaires ont également convenu, mais cela était induit par la structure de projet, de travailler sur un échantillon de données et sur un prototype préfigurant l'architecture technique cible.
L'utilisation du format UNIMARC/Autorités comme format commun d'échange étant inscrit dans les objectifs du projet, l'élaboration des tables de conversion a été faite d'emblée. Après que les partenaires se furent mis d'accord sur un modèle de tableau, chaque bibliothèque nationale a fait sa table de conversion du format national vers UNIMARC/Autorités, à l'exception du Portugal qui travaille déjà en UNIMARC. Le Portugal a coordonné ce travail et a veillé à la cohérence des résultats : un même type d'information saisi de façons différentes dans les formats nationaux doit après conversion se retrouver dans la même zone ou sous-zone du format UNIMARC ; par contre, deux informations de nature différente saisies de façon identique dans les formats nationaux doivent être traitées différemment lors de la conversion pour donner des résultats non ambigus en UNIMARC.
Tous les partenaires ont accepté de s'en tenir à la version officielle du format UNIMARC/Autorités publiée par l'IFLA en 1991 (et traduite en français en 1996), étant entendu que les problèmes rencontrés lors de la trans-codification seraient à terme transmis au Comité permanent UNIMARC chargé de faire évoluer le format.
Il était entendu que plus l'échantillon de données sélectionné pour la phase de test sur le prototype serait cohérent, plus les tests avaient de chance d'être efficaces. Pour permettre une réelle comparaison entre les notices d'autorité établies pour une même entité dans les différents fichiers des partenaires, on a décidé de sélectionner dans tous ces fichiers un certain nombre de noms d'auteurs et de collectivités.
Ainsi ont été extraites en priorité de chaque fichier source les notices d'autorité suivantes, quand elles existaient.
Noms de personne : Aristotele, Cicero, Garcia, Gandhi, Kim ll-Sung, Mahfuz, Mao Zedong, Martin, Scholem, Silva, Singer, Smith, Solzhenitsyn, et toutes les notices ayant une entrée commençant par 0 ou par T.
Collectivités : Communauté économique européenne et Nations-Unies, et tous leurs équivalents dans les autres langues des pays partenaires, de même que les notices contenant une entrée commençant par Association, Centre, Commission, Comité, Conférence, Congrès, Conseil... et tous leurs équivalents en anglais, espagnol, portugais, etc. et toutes les notices ayant une entrée commençant par 0 ou par T.
Un certain nombre d'autres notices relevant souvent d'un traitement particulier ont été aussi définies précisément : par exemple, celles consacrées à des familles ou à des imprimeurs libraires du xvie au XVIIe siècle.
Chaque partenaire pouvait compléter son jeu de notices par des notices d'autorité de son choix illustrant au mieux ses particularités ou ses domaines d'excellence.
L'échantillon devait comporter à terme plus de 120 000 notices provenant de la British Library (41 764), de la BNF (41 370), d'Espagne (22 244), du Portugal (11 024) et de Belgique (7 196).
Après une démonstration du logiciel UseMARCON par la Société Jouve qui l'a mis au point, chaque partenaire a préparé ses tables de référence et la conversion de ses notices en s'appuyant sur les tableaux de transcodification préalablement élaborés. Sans entrer dans le détail technique des opérations, indiquons simplement ici quelques-unes des principales difficultés rencontrées dans l'utilisation du logiciel UseMARCON, notamment dans la spécification des règles de conversion.
Le fait que UseMARCON a été mis au point pour des notices bibliographiques et non pour des notices d'autorité a mis en évidence quelques insuffisances du logiciel qui n'ont pu être entièrement résolues dans le cadre du Projet : par exemple il n'a pas été possible de générer une notice (notice d'autorité ou notice de renvoi) dans le format cible UNIMARC à partir d'une zone (vedette parallèle ou forme rejetée) d'un des formats source (notamment INTERMARC). Cette procédure exceptionnelle dans la gestion d'un fichier bibliographique est utile dans la gestion d'un fichier d'autorité.
Enfin le logiciel UseMARCON s'est révélé moins convivial que prévu pour les bibliothécaires et chaque bibliothèque partenaire a dû demander l'assistance technique d'un informaticien pour mener à bien l'écriture des programmes de conversion. Toutefois, les avantages l'ont emporté sur les inconvénients et le rapport d'évaluation de l'utilisation de UseMARCON conclut que ce logiciel est utilisable pour convertir des notices d'autorité moyennant quelques évolutions. Les partenaires ont donc pu convertir leurs échantillons de notices d'autorité en UNIMARC/Autorités avec cet outil.
Six scénarios ont été étudiés par les partenaires, chacun étant proposé avec un relevé des avantages et des inconvénients.
Le choix d'un scénario technique dépend de la combinaison de 3 critères :
Le scénario retenu pour le système cible est le scénario d'accès à distance aux fichiers d'autorité auteurs des différentes bibliothèques nationales. L'accès à des bases de données distribuées en réseau s'appuiera sur l'implémentation du protocole Z39.50 sur chaque serveur de notices d'autorité auteurs. Ceci permettra l'envoi d'une requête unique à différents serveurs et une réponse globale présentant les résultats de la recherche. La requête sera transmise par l'utilisateur final à partir de son poste de travail, équipé d'un logiciel de navigation du Web aux serveurs Z 39.50 des partenaires. Chaque serveur est mis à jour et maintenu par la bibliothèque partenaire, il donne accès à l'ensemble des autorités auteurs de cette bibliothèque, la conversion des notices vers le format UNIMARC sera faite à la volée.
Afin de démontrer la faisabilité du système-cible, un prototype de test a été développé suivant les spécifications fonctionnelles et techniques suivantes :
Le prototype a été développé par Index Data qui a également chargé les échantillons de notices en format UNIMARC/Autorités fournis par chaque partenaire. À partir de fin septembre 1997, le prototype a été opérationnel sur le Web où étaient également disponibles une information générale sur le Projet, la description précise de l'échantillon et un formulaire d'évaluation.
La promotion du projet AUTHOR a été faite par chaque bibliothèque partenaire dans son propre pays mais aussi au cours de plusieurs conférences internationales : à l'occasion de deux ateliers sur les notices d'autorité organisés dans le cadre du congrès annuel de l'IFLA à Pékin (août 1996) et Copenhague (août 1997), et lors d'un atelier sur le format UNIMARC qui s'est tenu à Luxembourg sous les auspices de la DGXIII de la Commission européenne (septembre 1996). Tous les participants à ces manifestations ont été officiellement invités à participer à la phase de test qui s'est déroulée d'octobre à décembre 1997. Les bibliothèques qui ont testé le prototype devaient décharger le formulaire d'évaluation et le renvoyer à la BNF. 37 formulaires d'évaluation ont été collectés, provenant de 52 individus ayant participé au test.
Il ressort que 16 bibliothèques dans 13 pays ont participé à l'évaluation : c'est-à-dire que 11 établissements dans 8 pays différents se sont associés à l'opération en plus des 5 bibliothèques partenaires du Projet. Cette large mobilisation des bibliothèques en Europe (Allemagne, Croatie, Finlande, Italie, Russie, Suède...) et aux États-Unis (Library of Congress, UCLA) met en évidence qu'un tel système d'accès aux fichiers d'autorité correspond à un réel besoin, tant pour les bibliothèques nationales que pour les grandes bibliothèques universitaires.
L'évaluation a été très riche en enseignements et ouvre de nombreuses pistes de travail exploitables dès à présent dans un contexte international pour améliorer le service qui devrait être rendu à terme. Sans entrer dans les détails, on peut résumer ainsi les principaux résultats.
Nous sommes donc sur la bonne voie aujourd'hui dans le domaine de la coopération internationale en matière de données d'autorité : les travaux en cours entre la Library of Congress et la British Library dans le but de réaliser un fichier d'autorité commun à ces 2 institutions (voir l'exposé d'Alan Danskin) et la mise en oeuvre du projet AUTHOR le prouvent. Nous sommes en train d'expérimenter ce qui depuis des années restait un simple souhait : l'échange de données d'autorité à l'échelon international. L'évolution des techniques facilite la réalisation concrète : les bibliothécaires s'approprient des techniques de communication de plus en plus sophistiquées, mises au point en dehors de leur champ d'action (Internet, Europagate, etc.) mais contribuent aussi directement à la mise au point des outils dont ils ont besoin (UseMARCON par exemple). Le résultat est que, loin de gommer les différences entre les pratiques nationales de catalogage, ces nouveaux outils nous permettent de les gérer et nous incitent à utiliser la richesse de nos voisins sans craindre de perdre notre spécificité. Il nous reste à apprendre à tirer le meilleur profit de nos différences pour enrichir nos catalogues mutuels sans dupliquer le travail d'identification des auteurs, toujours trop coûteux en temps et en effectif.