Un format est une structure carac- térisant la présentation des infor- mations au sein d'un ordinateur ». Sur les supports magnétiques, les don- nées sont enregistrées de façon continue, sans délimitations. Pour être lue par le programme de l'ordinateur, toute donnée doit être définie par un format.
En effet, les quatre besoins fondamen- taux du traitement de l'information sont : 1. le tri alphabétique ou numéri- que des données, 2. la sélection d'une donnée, 3. l'indexation, 4. l'impression.
Pour cela, il faut reconnaître les don- nées dans le continuum d'octets. On a donc défini des enregistrements, eux- mêmes divisés en « champs ou « zones », puis en 'sous-zones ,.
Les premiers formats étaient en zones fixes. Le numéro de sécurité sociale en est un exemple. Le programme sait que le premier caractère représente le sexe, les deux suivants l'année de naissance, et les traite en conséquence. Les pre- miers formats bibliographiques ont sui- vi cette règle où l'auteur se voyait at- tribuer 10 caractères, le titre 25 et ainsi de suite (cf. Agape (1) ).
Il y eut ensuite les formats variables avec des « drapeaux ou codes de zones : A = auteur, B = titre (IPEC). Mais la grande dé- couverte fut le format MARC américain en 1965. En effet, les précédents ne pou- vaient rendre compte complètement des données de catalogage (plusieurs auteurs, plusieurs titres, plusieurs vo- lumes, etc.). Ce format a introduit de nouveaux concepts qui ont permis de rendre compte de la complexité des no- tices bibliographiques :
Les éléments principaux du format MARC sont :
A partir de là, de nombreux pays ont fa- briqué leur propre format, en commen- çant par l'Angleterre (BNB-MARC) et la France (Monocle). Mais, auparavant, les Américains avaient eu la sage précaution de faire définir par l'ISO une norme in- ternationale qui donnera à tous les en- fants de MARC la même structure (ISO 2709). Enfin, en 1977, UNIMARC essaya de faire la synthèse en trouvant des compromis entre l'Europe et les États- Unis pour définir un format d'échange. La structure de tous ces formats est iden- tique, mais la codification détaillée de certains formats diffère légèrement.
Pourquoi ? Quatre raisons à ces diver- gences qui portent, il faut le dire, sur des détails et non sur la philosophie gé- nérale du format qui reste la même, sauf pour l'Allemagne qui, ayant des rè- gles de catalogage différentes (RAK), a créé un format différent de la famille des MARC (MABl).
La première raison se trouve dans les règles de catalogage. Un format traduit ces règles en un langage compréhensi- ble par l'informatique. Cela concerne, notamment, les règles de tri, de présen- tation des noms, la définition des élé- ments à prendre en compte, la ponctua- tion. Malgré les normes internationales, il n'est pas certain que les AACR2 (2) soient identiques aux normes françaises. Le catalogage n'est pas une science exacte (cf. dans l'OCLC, différentes notices pour le même ouvrage).
La deuxième raison se trouve dans l'ob- jectif que l'on se fixe en définissant un format. Les Américains, en créant l'US- MARC, n'avaient qu'un objectif : rem- placer leur système de distribution de fiches par la fourniture des notices sur bande magnétique. Donc aucun souci de tri ni de présentation. Par contre, quand les Français ont préparé Monocle puis INTERMARC, leur objectif a été la production de catalogues de différents types, dont le Catalogue général de la Bibliothèque nationale. Il faut rappeler qu'à cette époque, les fichiers en ligne n'existaient pas et que la seule sortie possible était le catalogue imprimé. UNIMARC a été défini comme un format d'échange entre bibliothèques natio- nales, donc comme un moyen terme en- tre la richesse des formats européens et la simplicité du format américain, aussi neutre que possible par rapport aux rè- gles de catalogage et à la ponctuation.
La troisième est le choix, ou non, de la flexibilité. Le format peut être neutre et ne contenir aucune règle préétablie ou, au contraire, fournir une codification précise des données pour en condition- ner le traitement. Dès le début, les au- teurs de MARC ont suivi cette voie que les formats suivants n'ont fait qu'appro- fondir. Ainsi, dans le premier format MARC, les codes de sous-zones étaient un$simple. Les Anglais et les Français ont demandé le rajout d'une lettre pour préciser ce séparateur ($a) et l'utiliser comme clé de tri.
La quatrième est le choix fait entre la re- dondance des informations et un traite- ment plus complexe. C'est-à-dire entre le tri et l'édition. Les Américains ont préféré répéter, si besoin était, l'auteur ou le titre dans leur forme à imprimer» et leur forme « à classer », alors que les Français ont inséré des codes pour que le traite- ment soit fait par l'ordinateur sur une même donnée non répétée. Ainsi, UNI- MARC met dans la même zone le titre pro- pre et le titre parallèle, alors qu'INTER- MARC leur attribue deux zones diffé- rentes. Facilité d'impression du pavé ISBD dans un cas, facilité d'accès dans l'autre.
Ces quatre raisons ont conduit les fabri- quants d'iNTERMARC à multiplier les codes de tri et de sélection (indicateurs pour distinguer les titres significatifs des non significatifs, codes de sous-zones pour préciser les éléments à garder ou à supprimer lors d'édition de listes abré- gées, etc.). Il faut rappeler que dans un grand catalogue les problèmes de rangement des notices sont difficiles (au- teurs prolifiques, homonymes, œuvres complètes, choisies, extraits, etc.).
Avant de porter un jugement péremp- toire sur les formats, il faut rappeler quelques vérités premières :
Cependant, cela ne veut pas dire que les précisions doivent disparaître, car l'inter- rogation booléenne en ligne de gros fi- chiers (10 à 30 millions de notices) né- cessite des index soigneusement codés et délimités. De même, l'affichage de no- tices abrégées nécessite un découpage précis des zones de données.
Partant du principe qu'il faut un format, et un format MARC, le choix de ce for- mat dans la famille des MARC ne peut plus être absolu et se fait donc mainte- nant sur des critères externes (fournis- seur principal des données, contexte national, règles de catalogage). La grande force des Américains est d'avoir accepté le format USMARC. Tous les ré- seaux sont donc dans le même format. C'est ce qu'il faut souhaiter à la France. Cette unité est plus importante que les subtilités du$b.