Je voudrais d'abord situer l'expérience que nous tentons ici. L'utilisation des ordinateurs par la documentation peut se répartir en deux groupes :
Le sujet est peut-être l'élément essentiel de recherche. Deux méthodes sont utilisées :
Beaucoup d'organismes ont les deux types de systèmes et rendent les deux formes de services à la fois.
Ils ne manipulent pas des articles, mais des livres et toutes sortes de documents. Le sujet n'est plus l'élément essentiel de la recherche. Les auteurs, la nature du document, son origine et son prix sont des éléments aussi nécessaires à rechercher dans ces systèmes que le sujet.
C'est dire que l'analyse et l'indexation sont moins poussées, que les thesaurus et systèmes de classification n'y sont pas fondamentaux et que les méthodes de recherche sont moins perfectionnées.
Si par certains côtés ces systèmes sont plus simples que la recherche documentaire (moins de problèmes logiques et sémantiques), par d'autres ils sont beaucoup plus complexes, car ils utilisent beaucoup plus de critères de tris, ayant des valeurs et des formes très différentes. Dans un cas, on prend une référence comme un tout que l'on caractérise par de nombreux mots-clés (jusqu'à 50) de nature identique. Dans l'autre cas, chaque référence est décortiquée en autant de rubriques que nécessaires, chacune faisant l'objet d'un tri donc d'une identification particulière.
J'ai voulu caractériser ainsi les différents systèmes afin de mieux situer l'expérience que nous poursuivons ici, par rapport à celles que vous avez déjà vues en opération au Cedocar, à l'I.F.A.C. ou ailleurs. Les buts et les moyens sont donc différents, mais les résultats sont parfois voisins, car nous produisons, nous aussi, des listes et des catalogues périodiques. Mais, comme on le verra, nous ne prévoyons pas dans un avenir immédiat d'interrogation directe de la machine.
Les raisons de cette différence peuvent se résumer ainsi :
Même la recherche limitée aux articles reçus pas la Bibliothèque demanderait un personnel largement accru ; le nombre et la diversité de nos chercheurs la rend pour le moment quasiment impossible. Nous ne l'envisageons que pour beaucoup plus tard.
Donc, la Bibliothèque doit, faute de moyens, se limiter à sa tâche première et essentielle qui est de fournir les documents demandés, c'est-àdire, d'abord enrichir ses collections, puis les classer, en établir un judicieux et complet catalogue pour en informer au mieux ses lecteurs.
Par ordre de priorité, la tâche d'une bibliothèque est donc de mécaniser ses travaux matériels, à savoir :
Nous nous sommes aperçus en effet qu'avec le personnel dont nous disposions, le catalogage et le signalement aux lecteurs de tous les livres achetés prenaient un retard croissant. La frappe et surtout l'intercalation des fiches sont des tâches longues et ennuyeuses. Reclasser ces fiches pour établir des listes d'acquisition devenait impossible et après quelques essais, nous avons arrêté la diffusion de ces listes. Nous manquions donc à notre premier devoir.
Lorsqu'ayant déménagé à Saint-Martin-d'Hères, la Bibliothèque se trouva à 200 mètres à peine de l'Institut de Mathématiques Appliquées et de son ordinateur IBM 360/67, contact fut pris avec les responsables de l'Institut pour essayer de mettre au point la mécanisation globale de l'opération.
L'ordinateur s'offrant à effectuer tous les tris dont nous avions besoin, l'idée s'imposa de lui confier, en premier lieu, la préparation d'un catalogue imprimé, hebdomadaire ou mensuel, de nos acquisitions. Mais tout de suite, plusieurs possibilités en découlèrent. Ce sont :
Notre objectif immédiat reste donc la mécanisation de certaines tâches, pour avoir la possibilité de fabriquer, à un prix et dans des délais raisonnables, un catalogue imprimé des volumes de la Bibliothèque, qui, éminemment mobile et largement diffusé, permettra au chercheur de travailler chez lui et constituera par rapport au fichier traditionnel trop unique et trop immobile un progrès important. Notre service aux lecteurs en sera donc amélioré.
Nous établissons toutefois nos programmes en prévoyant la possibilité, lorsque le fichier sera suffisamment garni, de le consulter à la demande et de faire ainsi dans quatre ou cinq ans de la recherche documentaire.
Pour étudier l'ensemble du problème, il fallait une idée non seulement des buts poursuivis, mais aussi des données numériques. Nous sommes partis pour chiffrer les temps et les coûts des quantités suivantes :
L'Institut de Mathématiques Appliquées nous offre donc son ordinateur 360/67 doublé d'un 360/40. Pour s'y rattacher, il y avait quatre possibilités :
La première solution fut rejetée comme périmée et onéreuse, le transfert devant se faire au centre de calcul sur un appareil dont l'utilisation nous serait facturée.
La deuxième solution ne convenait pas aux textes longs et ne permettait pas de fabriquer les fiches de catalogue par la même frappe qui perfore la bande.
La troisième solution n'est pas encore au point. Trois appareils fabriqués par Digidata, par IBM et par Mohawk-Data-Sciences sont disponibles, mais aucun n'a été testé par nous. De toute façon, il fallait, dans ce cas comme dans les deux premiers, porter au Centre de calcul les bandes ou cartes et aucune liaison n'était possible avec la machine. De plus, la plupart ont des caractères limités aux majuscules.
Nous avons donc choisi la dernière solution, qui ajoutait à la rapidité de transmission la possibilité ultérieure de questions directes à l'ordinateur et de recherches immédiates. C'était prévoir l'avenir. Elle permet aussi des corrections immédiates et directes du fichier.
Nous avons donc commandé un terminal IBM 1050, composé d'une unité de contrôle 1051, d'une imprimante 1052, d'un lecteur 1054 et d'un perforateur 1055 ; c'est en fait une simple machine à écrire à ruban perforé reliée à l'ordinateur par un fil téléphonique. Choisir un matériel de même marque était une garantie de compatibilité et l'IBM 1050, étant constitué d'une machine à écrire à boule, offre tous les caractères courants majuscules et minuscules (sauf pour le moment les signes diacritiques). Elle permet, et c'est important, la frappe en clair de la fiche mère sur papier pour relecture et corrections et son utilisation immédiate, sur bristol ou cliché Offset. Elle n'exige aucune formation particulière comme la perforation des cartes.
Evidemment, nous serons obligés de passer par l'intermédiaire de la bande papier perforée, mais celle-ci ne quitte pas la Bibliothèque, sa transcription sur bande magnétique s'effectue de la Bibliothèque par l'intermédiaire du fil téléphonique à l'unité de contrôle 2702, organe d'entrée du 360. Elle permet d'effectuer, en marche autonome, de la frappe répétitive. Nous pouvons donc facilement contrôler la rupture de bande ou les fautes de transmission. Si un 1050 est insuffisant, nous pourrons acheter un deuxième appareil isolé avec un perforateur et utiliser le lecteur du premier pour la transmission des bandes des deux machines. (Le maniement de cette machine ne pose aucun problème, puisque le fournisseur établit les programmes selon l'utilisation que vous voulez en faire.)
Pour la sortie, l'Institut de Mathématiques Appliquées nous offre une imprimante IBM 1403 NI à caractères majuscules. Nous nous sommes procuré une chaîne amovible supplémentaire 1416 à 120 caractères ayant les majuscules et les minuscules, donc plus apte aux travaux bibliographiques. La vitesse de cette chaîne est plus lente que celle d'une chaîne à 48 caractères, mais reste de l'ordre de 600 lignes/minute. Les signes diacritiques y sont facilement ajoutés. Nous pouvons, d'autre part, utiliser notre périphérique 1050 pour la sortie, aussi bien des listes que des réponses à des questions. L'ordinateur perfore alors une bande papier, ou déclenche la machine à écrire. C'est un autre avantage du système choisi. Mais la lenteur de frappe (15 caractères/seconde) de la machine à écrire rend cette facilité peu rentable pour les listes longues. Elle ne peut être utilisée que pour des réponses précises à des questions bibliographiques.
Enfin, pour le stockage de l'information et des programmes en machine, nous nous sommes procuré des disques de capacité moyenne, à savoir 29 millions de caractères par disque (Dispac 2316), soit pour 6 millions de caractères par an, la capacité de stocker l'information de cinq ans. Le prix de ces disques est modique. Ils sont amovibles et n'encombrent pas la machine en dehors des vacations. L'unité de disque en contient 8, soit 232 millions de caractères.
Par économie, nous partagerons d'autre part l'unité de contrôle 2702 avec un autre centre de documentation. En effet, nous pensons ne l'utiliser que quelques heures par semaine, laissant en dehors de nos vacations l'unité libre pour d'autres terminaux.
Lorsque nous envisagerons la recherche documentaire individuelle, un écran cathodique avec un crayon marqueur sera sans doute nécessaire pour accélérer les réponses et la mise au point des questions, et pour photocopier les listes sur l'écran lui-même, ce qui sera plus rapide encore que l'imprimante.
Cela étant précisé, il nous fallait définir trois points :
Nous partons d'une fiche signalétique complète rédigee selon les normes de l'AFNOR, à la seule différence près que la cote C.D.U., au lieu d'être dans la marge de gauche, est sur une seule ligne au-dessus du nom de l'auteur ou du titre à gauche ; ceci pour des raisons techniques. La (ou les) cote (s) inventaire sont en bas, à droite. Tous les renvois de vedettes (auteurs, éditeurs, matières, C.D.U. développée) figurent en note à gauche, sur les fiches mais pas sur les listes.
La liste hebdomadaire des nouvelles acquisitions est classée selon la C.D.U. simplifiée à trois chiffres et diffusée en 700 exemplaires.
Nous prévoyons ensuite une liste mensuelle par cote inventaire et des renseignements succincts pour constituer un registre d'acquisition (cote, auteur, titre abrégé, éditeur, date, fournisseur, prix, destination).
Puis, semestriellement ou annuellement, nous publierons le catalogue complet des livres. Plusieurs possibilités s'offrent à nous :
Nous avons finalement choisi le premier, plus conforme aux besoins des lecteurs, plus simple à consulter et pas plus difficile ni plus long à exécuter par la machine.
Puis des répertoires annexes sont prévus :
puis des statistiques :
Un point particulier à signaler est le traitement identique des livres, des articles et des périodiques. En effet le bordereau de catalogue est assez souple pour s'adapter aux trois types de références (simplification des procédures) ; les fiches seront mélangées dans le catalogue général, mais par le système des zones, nous avons la possibilité de sortir les périodiques (ou les thèses) isolément quand nous voulons. De plus, la frontière entre livres et périodiques est de plus en plus confuse. Nous croyons qu'il y a intérêt à les traiter ensemble.
Deux problèmes ont dû être considérés pour l'organisation des fichiers.
Tout d'abord, les tris demandés en priorité sont aisément faits à partir de fichiers séquentiels dans lesquels les notices sont enregistrées dans un ordre quelconque (ordre d'entrée par exemple). H est inutile d'effectuer un préclassement par élément de tri (auteurs, matières, C.D.U.) et de mettre à jour, chaque semaine, chaque fichier ainsi trié. Il suffit d'ajouter les nouvelles notices à la suite les unes des autres en leur donnant un numéro d'ordre successif et de faire les tris une fois par an.
Pour un disque complet 2316, soit 29 millions de caractères ou 40.000 références, il faut un quart d'heure environ pour le tri complet selon plusieurs critères différents à la fois.
Les tris s'effectueront selon la méthode des zones, c'est-à-dire que chaque élément de tri (auteur, titre, matière, C.D.U.) aura le même numéro dans les différentes notices et que la machine triera selon ce numéro de zone. Nous attendons l'expérience pour déterminer exactement le nombre et le type des fichiers sur disque que nous utiliserons.
Il est certain toutefois que nous aurons :
Ce sont les deux fichiers de base. Il faudra leur ajouter des fichiers annexes :
Le fichier des données est la suite chronologique des notices ellesmêmes en zones variables. Pour construire cette notice, nous sommes partis de plusieurs éléments : la grille préparée à Paris pour la Bibliographie de la France, une analyse catalographique effectuée par nous et celle effectuée par les Anglo-américains dans les projets B.N.B. MARC. Nous avons cherché une notice qui soit utilisable par les bibliothèques françaises et donc qui comprenne le maximum de renseignements de façon assez souple pour que chacun puisse choisir ce qui lui plait. Il fallait aussi qu'elle soit compatible avec la notice anglo-américaine, afin que nous puissions utiliser les bandes magnétiques diffusées actuellement par la Bibliothèque du Congrès ($ 600 par an) et qui nous donneront le catalogue de tous les livres anglo-saxons. Dons un énorme travail en moins.
Je ne peux décrire ici la notice entière, car elle est très détaillée et très complète. Les zones sont codées par des chiffres.
Exemple : 100 = Auteur vedette principale 080 = C.D.U.
Les codes sont donc à trois chiffres. Ils sont suivis par deux chiffres appelés indicateurs qui permettent d'ajouter des éléments de tri particuliers. Par exemple : sous l'étiquette 009 Langues
l'indicateur 01 = traduction 00 = oeuvre multilingue
Des sous-zones sont ensuite délimitées dans la zone par la mention $a, $b... qui permet de séparer certaines parties ne nécessitant pas une zone particulière. Il y a donc une identification à deux niveaux, et à trois niveaux si l'on considère les indicateurs. Ceci est très complet et très souple. Derrière chaque sous-code, le texte est écrit en clair et en longueur variable. La zone se termine par un code fin de zone ≠ . Une des caractéristiques de ce système mis au point à la fois par M. Dagand et par la Bibliothèque du Congrès, est que le nombre des zones est très important (87), mais que seules les zones nécessaires sont utilisées.
Exemple : un roman français ne comportera que les zones suivantes :
Pour avoir facilement accès au premier fichier, un deuxième fichier est nécessaire. C'est le fichier index qui comprend deux parties bien différentes :
Exemple : 240 0154 00456 I I I n° zone longueur adresse
L'organisation exacte de cet index n'est pas encore définitive et beaucoup de choses risquent encore de varier dans cette notice.
H est possible qu'il nous faille des fichiers spéciaux par types de documents, plus les fichiers index matières, auteurs et C.D.U. De la vitesse des tris dépendra la solution, et ceci est une question de programmation dont s'occupent Mme Guelton et Mlle Favand.
Ils sont le domaine des spécialistes de l'Institut. Seul le résultat compte pour l'utilisateur ignare que nous sommes. La seule chose que nous sachions est que nous utiliserons un langage Cobol pour les tris et Assembleur ou CP/CMS pour l'entrée des données à partir du 1050. Nous formons actuellement un bibliothécaire à la programmation afin qu'il puisse gérer l'opération plus tard. Il vaut mieux que le début soit mis au point par des ingénieurs spécialisés en informatique, en liaison avec le bibliothécaire qui fournit les éléments de base.
Pour permettre l'entrée des données dans la machine, nous avons mis sur pied un bordereau de catalogage. Ce bordereau sera rempli par les sous-bibliothécaires, puis, après correction, perforé par une dactylo sur le 1050. En même temps qu'elle perforera la bande papier, elle frappera une première fois sa fiche.
Les caractères statistiques sont aussi perforés et tapés. Le texte est relu puis retapé par simple passage de la bande dans le lecteur (nous utilisons ainsi la machine en autonome et comme une simple machine à répétition) pour reperforation d'une bande sans faute.
La bande est stockée en continu. Une fois pas jour une vacation est demandée à l'ordinateur et le rouleau de bande perforée transmis par la ligne téléphonique. Pour vérification, les documents entrés en machine sont listés, puis les corrections effectuées sous programme CP/CMS. De nombreux contrôles seront établis par programme pour la validité des textes transmis.
Puis la machine triera ces notices par cote C.D.U. et les sortira sur l'imprimante à majuscules et minuscules. L'impression se fera sur deux colonnes formant une page de 32 x 42 environ qui par réduction photographique, sera reproduite en 21 x 27.
Puis les notices seront scindées en deux et rajoutées aux deux fichiers principaux sur disques magnétique, en attendant les tris mensuels, semestriels et annuels.
Voilà ce que nous avons l'intention de faire. Actuellement, les retards ont été nombreux, provenant aussi bien du matériel non livré à temps (le 1050 a eu six mois de retard) que du personnel qui est encore insuffisant. Mais, petit à petit, notre équipe s'étoffe. Théoriquement elle devrait se composer de :
Jusqu'à présent nous sommes loin de ces chiffres, mais grâce à une excellente entente avec l'Institut de mathématiques appliquées, les programmes ont pu être progressivement écrits et testés par des stagiaires de l'Institut de programmation, sous la direction et avec l'aide bénévole mais très efficace de Mme Guelton. Jusqu'à présent, le coût a été réduit puisque l'opération est considérée comme sujet de recherche et nous espérons continuer dans ce sens jusqu'à la phase opérationnelle.
Nous espérons disposer dans un an de tous les programmes nécessaires à la gestion d'un catalogue de bibliothèque, et je ne vois pour ma part aucune difficulté à ce que d'autres bibliothèques reproduisent ces programmes et les utilisent, à condition d'avoir un ordinateur identique et d'accepter le bordereau de catalogage tel qu'il est. De toute façon, l'ordinateur de Grenoble pourra regrouper très vite toutes les acquisitions de la région Rhône-Alpes (de Lyon à Nice par exemple) en un catalogue collectif unique dont chacun aura une copie. La liaison se fera soit par envoi de bandes perforées, soit par terminal, soit par envoi de bandes magnétiques. Il faut que très vite cette automation débouche sur des catalogues collectifs régionaux, puis nationaux.
Nous avons une chance exceptionnelle à Grenoble de pouvoir travailler dans des conditions presque idéales, mais nous entendons bien faire profiter toutes les bibliothèques du résultat afin que le même travail ne soit pas inutilement refait par chacun pour son propre compte. La notice (1) est me semble-t-il, suffisamment souple et riche pour être acceptée par toutes les bibliothèques, et nous sommes prêts à la soumettre à l'enquête publique pour la parfaire. Il serait souhaitable d'envisager des réunions des personnes intéressées afin d'arriver à une mise au point définitive. Le reste du travail de programmation pourrait être fait ici.
Reste à étudier l'automation des acquisitions, puis celle du prêt. La Bibliothèque municipale de Lyon envisage de le faire et nous profiterons volontiers de son analyse et de ses programmes. L'essentiel est de travailler sur une notice catalographique unique qui puisse servir dans toutes les opérations de la bibliothèque.
Lorsque les catalogues collectifs seront disponibles et que plusieurs bibliothèques seront reliées au même catalogue, dans un même ordinateur, il faudra envisager l'utilisation d'écrans de visualisation et surtout de télé-électrocopie pour accélérer la transmission des documents eux-mêmes.
Tout ceci, voyez-vous, peut paraître mythologique mais il est certain que les bibliothèques seront d'ici dix ans toutes automatisées et que cette automation, dont on parle beaucoup sans la bien connaître, n'est pas un monstre sacré, mais un travail à la fois plus simple et plus complexe qu'il ne paraît.
Il n'y a, par conséquent, pas de temps à perdre pour s'y préparer.