Index des revues

  • Index des revues

L'emploi d'ordinateurs électroniques pour l'édition de bibliographies nationales : L'exemple de la Deutsche bibliographie

1967

    L'emploi d'ordinateurs électroniques pour l'édition de bibliographies nationales : L'exemple de la Deutsche bibliographie

    Par Kurt Köster

    Texte de la communication présentée le 14 septembre 1966 au 32e Conseil de la F.I.A.B. à Scheveningen

    Parmi les bibliothèques de la République fédérale allemande, la Deutsche Bibliothek occupe une position particulière. Sous quelques réserves, on peut la mettre au même rang que les bibliothèques nationales des autres pays, qui ont l'obligation de rassembler la production imprimée nationale, de la conserver et de publier la bibliographie nationale courante.

    Mais à l'inverse de la plupart des bibliothèques nationales, la Deutsche Bibliothek est une institution assez jeune. Elle a été fondée après la deuxième guerre mondiale, en 1946, sous la contrainte de la situation politique ; elle s'est préoccupée intensivement de constituer des collections aussi complètes que possible, de toutes les publications parues en Allemagne depuis 1945, et des publications de langue allemande éditées à l'étranger. La Deutsche Bibliothek enregistre ses entrées sous le titre général Deutsche Bibliographie en six bibliographies périodiques :

    • 1. Deutsche Bibliographie. Répertoire hebdomadaire. Ce répertoire est divisé en trois séries : Série A. Livres diffusés en librairies (Index mensuels et trimestriels). Série B. Publications hors commerce (Supplément de la série A ; bimensuel ; Index annuel). Série C. Cartes (Supplément de la série A ; trimestriel ; Index annuel).
    • 2. Deutsche Bibliographie. Répertoire semestriel.
    • 3. Deutsche Bibliographie. Répertoire quinquennal.
    • 4. Deutsche Bibliographie. Répertoire de périodiques (quinquennal).
    • 5. Deutsche Bibliographie. Répertoire de publications officielles (biennal).
    • 6. Deutsche Bibliographie. Le Livre allemand. Tous les deux mois. Sélection extraite de la Deutsche Bibliographie, d'un intérêt capital pour les acquisitions de livres allemands à l'étranger.

    Les six répertoires réunis comptaient, en 1965, 13 000 pages environ ; en 1951, il y avait 5 000 pages imprimées, et en 1959, environ 7 500.

    Contrairement à la quantité de livres qui augmente rapidement et constamment, les possibilités de recruter du personnel qualifié, ou des auxiliaires aptes au travail bibliographique, diminuèrent de plus en plus. Même les heures supplémentaires et les mesures de rationalisation n'ont pu modifier la disproportion entre travail et personnel. On arrivait encore à cataloguer, sans retard notable, les ouvrages entrant dans la Deutsche Bibliothek, et à publier le répertoire hebdomadaire ; mais le retard de la parution des récapitulations semestrielles et quinquennales ne faisait qu'augmenter, puisqu'on était obligé de retirer sans cesse du personnel des services de rédaction. C'est pourquoi les répertoires semestriels n'étaient publiés que douze ou quinze mois après la fin de la période concernée, et quant aux répertoires quinquennaux, ni la tranche de 1950-1955, ni celle de 1956-1960 ne sont encore terminées. Ce retard des bibliographies semestrielles et quinquennales, s'aggravant sans cesse, fut à l'origine de la décision de la Deutsche Bibliothek de compiler la Deutsche Bibliographie dès 1966 à l'aide d'un ordinateur électronique.

    A cause des tranches quinquennales, un changement ne pouvait être envisagé par la suite qu'en 1971. Il était impossible d'attendre si longtemps. Pendant cinq ans encore, nous aurions été obligés de continuer à établir à la main chaque répertoire semestriel à l'aide des fiches manuscrites du répertoire hebdomadaire. Comme par le passé, on aurait été obligé également de les faire composer à nouveau par l'imprimeur. Puisque de nouvelles fautes typographiques risquent de se produire à chaque nouvelle composition, il aurait donc été nécessaire de corriger, comme d'habitude, les épreuves d'imprimerie et la mise en pages.

    Il fut donc facile de concevoir que l'aide d'un ordinateur électronique serait extrêmement utile à ce stade, car au fond, les répertoires semestriels et quinquennaux ne contiennent rien d'autre que les titres enregistrés déjà dans les répertoires hebdomadaires. Ils sont seulement présentés sous une autre forme : le répertoire hebdomadaire est classé systématiquement en vingt-cinq grandes sections, et pour la consultation on y ajoute un index d'auteurs et de mots-typiques. En revanche, dans les répertoires semestriels et quinquennaux, les notices ne sont pas classées systématiquement, mais alphabétiquement ; cette liste est complétée par un index de mots-typiques et de mots-matières.

    Le classement et le remaniement des notices - travail long et minutieux - peut être réalisé avec incomparablement plus de rapidité et d'exactitude par un ordinateur électronique. En outre, celui-ci est capable d'isoler quelques éléments de la notice, par exemple les mots-typiques ou les noms d'auteurs, et de les sortir en ordre alphabétique, c'est-à-dire qu'il est capable d'établir les index souhaités. Que l'emploi d'ordinateurs électroniques puisse apporter des avantages hors du domaine des données non numériques - par exemple en préparant les index - cela n'est pas nouveau. Depuis quelque temps déjà, on se sert de ces moyens modernes, et particulièrement dans la documentation spécialisée des sciences (rappelons l'Index medicus ou les Chemical abstracts). Il n'est pas nécessaire d'insister ici devant vous sur le fait que les titres, enregistrés dans une bibliographie nationale, sont beaucoup plus différenciés que ceux d'une documentation scientifique. Les difficultés que rencontrent les bibliothécaires et les programmeurs, en préparant des données aussi complexes pour un ordinateur électronique, sont parmi les raisons principales qui ont empêché, jusqu'à présent, qu'une bibliographie nationale soit établie à l'aide d'un ordinateur. Un autre problème se posait. Les données traitées par l'ordinateur sont malheureusement reproduites, en général, par une imprimante rapide. Les tambours d'impression ou les chaînes de la plupart des imprimantes rapides ne contiennent que des lettres majuscules, des chiffres et quelques signes de ponctuation. On ne peut donc les utiliser ni pour la reproduction des lettres minuscules, ni pour celle des accents (signes diacritiques) ; il manque également des styles de caractère (demi-gras, italique, etc.). Or, sans avoir l'ambition de rivaliser avec un ouvrage de bibliophilie, une bibliographie nationale ne peut, à notre avis, renoncer ni à un caractère clair et typographiquement agréable, ni à une orthographe exacte des noms. C'est grâce au Centre de documentation mécanique installé à Francfort par l'Institut de documentation que ce problème a pu être résolu. Je vous exposerai en quelques mots les différentes phases de travail à franchir.

    A la première phase, il y a les notices bibliographiques habituelles, rédigées dans le service de catalogage et dactylographiées. A la deuxième phase, ces fiches de catalogue sont réparties dans les sections systématiques du répertoire hebdomadaire, et numérotées à la suite par une folioteuse ; ensuite, elles sont munies de quelques signes (pour diriger l'ordinateur), dont je parlerai plus tard. A la troisième phase, ces fiches sont copiées par une claviste qui utilise une machine à écrire à bande perforée. Celle-ci produit une bande perforée et en même temps, comme une machine à écrire ordinaire, un texte en clair, qui permet de vérifier l'exactitude des perforations.

    Supposons que la bande en papier soit perforée sans faute ; on pourrait la faire entrer directement dans l'ordinateur, et commencer à la traiter. La vitesse d'entrée d'une bande perforée étant de 1 000 signes par seconde au maximum, et par contre celle d'une bande magnétique de 60 000 signes par seconde, la bande perforée obtenue est transformée en bande magnétique par l'intermédiaire d'un convertisseur. La phase, jusqu'à l'entrée des données, est ainsi terminée ; l'ordinateur peut commencer à traiter le matériel à la demande (c'est-à-dire selon les ordres des cartes perforées du programme).

    Il peut établir, par exemple, un index d'éditeurs ou un index des mots typiques ; ou il peut réunir quatre répertoires hebdomadaires, pour en faire un répertoire mensuel ; ou il peut cumuler, finalement, 26 catalogues hebdomadaires dans un répertoire semestriel. Dans la phase suivante, le matériel traité, prenons par exemple un index mensuel, cumulant quatre listes hebdomadaires, est sorti directement sous forme d'une bande perforée, par une perforatrice attachée à l'ordinateur. La phase du traitement électronique des données est terminée avec la sortie de la bande perforée.

    La bande perforée sert à la direction automatique d'une machine à composer Linoquick, c'est-à-dire d'une simple machine à composer en ligne, qui peut être manoeuvrée à la main, et être dirigée aussi par une bande perforée. Puisque maintenant la machine à composer est commandée par la bande perforée, et non plus par le claviste, il n'est plus possible que la main du compositeur tape de fausses lettres (par exemple un « o » au lieu d'un « a »

    La Linoquick sort la composition en plomb, ligne par ligne ; chaque ligne peut, à volonté, être modifiée, supprimée, ou remplacée par une autre ligne composée à la main. De la même manière, on peut transposer des titres entiers, ou les remplacer par d'autres, composés à la main. La Linoquick n'est pas seulement le dernier maillon de notre chaîne technique, mais c'est aussi le plus faible. Ce qu'elle peut faire est étonnant, mais l'électronique demande d'autres mesures, concernant la vitesse et l'exactitude.

    Si on passe d'un ordinateur électrique à une machine à fondre par lignes, c'est-à-dire de l'électronique à la mécanique, la différence apparaît immédiatement. L'ordinateur peut sortir 1 000 signes par seconde sur une bande magnétique. La perforatrice, qui sort les bandes perforées destinées à commander la Linoquick, ne parvient cependant à produire que 150 signes par seconde. Mais, de ces 150 signes, la Linoquick ne peut utiliser qu'à peu près 5 signes par seconde. Pour faciliter la comparaison, disons qu'un typographe ne parvient à produire que deux ou trois signes par seconde. Pour cette raison nous savons bien que nous ne pourrons atteindre notre but qu'au moment où nous aurons à notre disposition une photocomposeuse, jointe à l'ordinateur et dirigée par bande magnétique. Celle-ci rendrait inutile la sortie de bandes perforées, et la composition en plomb. A Paris en 1965 et à la Foire de Hanovre en 1966, ont été présentées pour la première fois en Europe de telles installations, et la Deutsche Bibliothek, en relation avec le Centre de documentation mécanique, a étudié attentivement cette évolution.

    Après cette brève description de l'entrée, du traitement, et de la sortie des données, permettez-moi de vous indiquer finalement à l'aide d'un simple exemple, comment nous rédigeons et préparons le catalogage des titres pour le traitement électronique.

    L'exemple que vous trouverez à la page 1 de l'annexe n'est pas fictif. Il a été enregistré sous le numéro 478 du fascicule 7 de 1966 du répertoire hebdomadaire, comme le prouvent les numéros imprimés. La forme du catalogage diffère un peu de la forme habituelle ; c'est celle qui a été retenue pour la Deutsche Bibliographie. Puisque le haut de la fiche n'est pas imprimé, le texte de la notice doit commencer par le nom de l'auteur. La vedette de classement, qui doit être imprimée avec un caractère demi-gras, dans notre cas le nom authentique de l'auteur (Marek, Kurt Wilhelm), est souligné en noir ; le pseudonyme (Ceram, C.W.), par contre, est souligné en rouge.

    Le premier mot vedette du titre (dans notre cas : Götter) est espacé. En suivant les recommandations de la Conférence de Paris de 1961 sur les règles de catalogage, la Deutsche Bibliographie a adopté à partir de 1966 l'ordre mécanique (ordre alphabétique du premier mot du titre) et l'introduction de la collectivité-auteur. Au début du titre l'article défini et indéfini est supprimé. Ce double changement apportait avec lui des difficultés particulières, sur lesquelles je ne peut m'étendre ici. Ensuite, les éléments de la notice que l'on reprend dans les index d'auteurs et de mots typiques sont limités par des traits rouges (un trait rouge avant Marek, et un trait rouge après Dokumenten). En même temps, on marque d'un point rouge le nom de l'auteur et les mots typiques (points rouges au-dessus des mots : Marek, Götter, Gräber, Gelehrte). Ensuite on indique au moyen de trois traits bleus les autres éléments des notices qui seront conservés et classés alphabétiquement dans l'index des matières des répertoires semestriels et quinquennaux. En général, c'est le titre, l'année de parution et le nombre de pages. Les sous-titres y sont compris, s'ils contiennent des précisions supplémentaires et nécessaires.

    Après avoir mis le numéro d'ordre du répertoire hebdomadaire et les signes en couleur sur la fiche de la notice principale, on frappe une bande perforée à l'aide d'une machine à écrire spéciale. Cela se fait à l'aide d'un système bien déterminé que vous trouverez à la page 1 de l'annexe sous « b ». La première ligne, appelée « catégorie 010», est réservée aux ouvrages d'auteurs ; la catégorie 011 aux oeuvres de collectivités-auteurs, et la catégorie 012 aux titres des ouvrages anonymes. Dans le cas présent, le numéro complet du titre est enregistré dans la catégorie 010 (66, A 07, 0478). Ce numéro est important parce qu'on l'emploie pour identifier le titre auquel correspondent les vedettes-matières, et aussi en cas de corrections. On enregistre ensuite le pseudonyme dans la catégorie 25 ; l'ordinateur renvoie automatiquement au texte demi-gras. La ligne suivante, 30, est appelée ligne typographique. On y enregistre le début de la notice et on y ajoute les deux premières lettres du mot-vedette du titre espacé (Marek, Kurt Wilhelm : G ö). Après la ligne réservée à l'éditeur (35) il y a, commençant à la ligne 40, la copie exacte du titre entier avec tous les signes servant de repère. Le début et la fin des caractères demi-gras du nom de l'auteur sont marqués par deux astérisques dans le texte en clair de la machine à bande perforée. Les traits rouges de limitation sont devenus des symboles du dollar. Les points rouges se retrouvent dans le texte clair (avant les mots : Marek, Götter, Gräber, Gelehrte), sous la forme d'un signe spécial, un petit a dans un cercle.

    Si l'ordinateur reçoit l'ordre d'établir un index d'auteurs et un de mots typiques, il produit les lignes suivantes :

    • 1. Marek, Kurt Wilhelm, Götter, Gräber und Gelehrte in Dokumenten.
    • 2. Götter, Gräber und Gelehrte in Dokumenten.
    • 3. Gräber und Gelehrte in Dokumenten. Götter,
    • 4. Gelehrte in Dokumenten. Götter, Gräber und

    L'ordinateur sépare donc la partie du titre, limitée par des traits rouges, du reste, et il classe selon les mots typiques signalés. Si on examine les deuxième, troisième et quatrième lignes, on voit exactement le principe dont l'ordinateur se sert. Si le mot typique est le premier mot de la partie du titre qui doit paraître dans l'index, il n'y a rien d'autre à signaler. L'ordinateur reproduit cette partie du titre du début jusqu'à la fin. Si le mot typique se trouve en second ou en troisième lieu, ou même plus loin, la machine produit la partie du titre à partir du mot typique jusqu'au point et, après le point, du début jusqu'au mot typique. On appelle cela une « permutation circulaire ». Le titre forme, pour ainsi dire, un cercle qui tourne autour de son propre axe. Et à chaque révolution, il y a un changement, une permutation du premier mot, c'est-à-dire du mot typique. Pour cette raison, on appelle les mots typiques également « mots de permutation », et les parties du titre qui sont à enregistrer, «textes de permutation». Dans l'exemple ci-joint, nous n'avons marqué que quatre points rouges et deux traits de limitation, nous avons donc employé une seule permutation. Mais on pourrait admettre jusqu'à quatre textes de permutation, chacun avec neuf mots de permutation, c'est-à-dire trente-six mots de permutation au total. Un astérisque ou le symbole « dollar » peut être oublié facilement au cours de la perforation. L'ordinateur est heureusement capable de contrôler automatiquement la présence de l'intégralité des signes, mais jusqu'à un certain degré. Chaque notice de catalogage doit présenter deux astérisques, pas plus et pas moins. En outre, elle doit être munie de deux symboles dollar au moins, ou bien de quatre, de six ou de huit, mais toujours d'un nombre pair. Un mot typique au moins doit être indiqué dans chaque titre, et les trois traits bleus de la notice principale doivent toujours exister. L'ordinateur peut contrôler tout cela, et il le fait ; si, par exemple, une notice a été perforée d'un seul astérisque, l'ordinateur sort un ordre de contrôle portant le texte suivant : « Un astérisque manque au numéro 478». Mais l'ordinateur ne peut pas détecter si seulement trois au lieu des quatre mots typiques prévus ont été signalés.

    Nous arrivons maintenant à la question des possibilités de correction : si la claviste qui utilise la machine à écrire à bande perforée s'est trompée, elle peut corriger ses fautes de différentes manières. Si elle remarque sa faute en tapant la ligne, elle tape trois fois la lettre qqq à la fin de la ligne, pour annuler ainsi cette ligne (la ligne 44 de notre exemple figure un tel cas). Si elle ne remarque son erreur qu'à la fin du titre, elle tape trois fois la lettre j j j. Si une faute d'orthographe a été remarquée plus tard, par exemple en corrigeant les épreuves du texte en clair qui sort en même temps que la bande perforée, les lignes incorrectes doivent être perforées sur une autre bande que l'on appelle « bande de correction ». Dès que la bande de correction est entrée dans l'ordinateur - elle aussi doit être transformée en bande magnétique -, celui-ci remplace les lignes (ou les notices) fausses par les nouvelles qui sont correctes. La notice bibliographique de notre titre est ainsi préparée pour être traitée par l'ordinateur. A la page 1 de l'annexe, sous « b », on voit que nous avons prévu le traitement de cas plus compliqués. Nous pouvons, par exemple, établir automatiquement, en utilisant la ligne 20,des renvois d'éditeurs, de rédacteurs, d'auteurs secondaires, ou de traducteurs (1) .

    Examinons encore une question souvent posée : on peut se demander peut-être pour quelle raison nous utilisons une ligne spéciale pour établir l'index des éditeurs (la ligne 35), alors que l'index des mots typiques se fait à l'aide de points de repère et sans réunir auparavant dans une même ligne tous les mots-typiques. Théoriquement, on pourrait employer aussi ces points de repère pour les index d'éditeurs, mais la réserve en est épuisée. Les machines à écrire à bande perforée n'ont à leur disposition que 88 signes. On peut choisir les signes du clavier de la machine à écrire à bande perforée, selon les nécessités. La Deutsche Bibliothek a retenu les signes que vous trouverez à la dernière page de l'annexe.

    58 positions ont été prévues pour les lettres majuscules et minuscules, y compris les diphtongues, 10 pour les chiffres, 7 pour les signaux et les signes de repérage, et les dernières 14 positions ont été réservées, après examen de statistiques, à l'é très utilisé, à la ponctuation la plus souvent employée, et aux parenthèses. Toutes les lignes de texte contenant d'autres signes, par exemple le è, doivent être composées de nouveau à la main. L'ensemble de ces lignes ne dépasse pas 3 %. C'est cette limitation à 88 signes qui nous a obligés, par exemple, à ne pas traiter de la même manière les noms d'éditeurs et les mots-typiques. Nous avons développé une méthode dite « combinée » qui utilise en partie des repères et des «lignes de catégorie» spéciales. Cette méthode combinée s'est montrée tout à fait satisfaisante pour nos travaux bibliographiques. Comme nous n'avons pas encore attribué toutes les lignes de catégories, cette méthode est élastique et peut être développée beaucoup plus encore. Nous pourrions, par exemple, mettre dans une ligne de catégorie encore libre le numéro de la classification décimale pour rédiger ainsi plus tard un index général, classé systématiquement, ou une bibliographie spéciale à certaines disciplines.

    Certains problèmes, comme par exemple celui de la coupure automatique des mots ou celui de la justification du texte, n'étaient pas encore résolus parfaitement, lorsque nous nous sommes décidés à utiliser un ordinateur, soit à partir du 1e r janvier 1966. A cause de la périodicité de nos répertoires quinquennaux, nous aurions dû attendre jusqu'à 1971, c'est-à-dire que nos prochains répertoires auraient paru très en retard, ce qui aurait été inexcusable.

    A partir du 1er janvier 1966 cependant, les publications suivantes ont paru sans aucun retard et sans très grandes complications :

    • 38 cahiers du répertoire hebdomadaire, série A.
    • 19 cahiers du supplément, série B (Publications hors commerce).
    • 2 cahiers du supplément trimestriel, série C (Cartes).
    • 6 index mensuels de la série A (janvier, février, avril, mai, juillet, août).
    • 2 index trimestriels de la série A (mars, juin).

    Seule l'édition du premier index trimestriel fut retardée. A ce moment, nous n'avions à notre disposition qu'une seule imprimante rapide commandée par bande perforée, la Linoquick, qui servait en même temps pour la composition des cahiers courants.

    Les avantages principaux de l'emploi d'ordinateurs électroniques seront visibles, comme on l'a déjà dit, dans la préparation des cumulations semestrielles et pluriennales.

    A la Foire internationale du livre de Francfort, qui aura lieu la semaine prochaine (2) , nous présenterons le premier répertoire semestriel de 1966 tout à fait terminé, c'est-à-dire la partie principale alphabétique avec un index de mots typiques, ainsi qu'un index alphabétique par sujets. Le temps habituel de préparation de 12 à 15 mois a été réduit à deux mois et demi. L'élaboration de ces trois parties par l'ordinateur était terminée le 29 juin 1966, avant même la fin du semestre, c'est-à-dire que tout le matériel de bandes perforées fut prêt pour la composition automatique à la fin de la période traitée. Avec les méthodes traditionnelles, nous aurions été obligés au moins de doubler notre personnel pour arriver à ce résultat. Pour le moment, une telle augmentation du personnel est tout à fait impossible en raison des difficultés de recrutement. Inutile de souligner qu'un ordinateur, malgré toutes ses possibilités, ne peut assurer qu'une petite partie du travail du bibliothécaire. Il décharge celui-ci - et cela est sûr - de la responsabilité de l'impression mécanique, peu attrayante, et de toute cette partie absorbante du travail. S'il peut toutefois effectuer le classement et le reclassement des titres, et l'établissement des différents index, et si, grâce à la commande automatique des imprimantes par bandes perforées, il empêche qu'à chaque cumulation de nouvelles fautes typographiques se produisent, il contribuera sans doute à accélérer la parution des bibliographies en augmentant en même temps leur valeur.

    Cela ne veut pas dire que l'homme se soumet à la machine, il la met, au contraire, à son service d'une manière ingénieuse. Même avec ces nouvelles méthodes, le travail du bibliothécaire reste toujours irremplaçable et prédominant.

    Traduction revue par M.-L. BOSSUAT

    Vignette de l'image.Illustration
    a) Zettel der Titelaufnahme

    (3)

    Vignette de l'image.Illustration
    b) Schema der Ablochung

    Vignette de l'image.Illustration
    c) Ablochung der Aufnahme

    Vignette de l'image.Illustration
    d) Ablochung der Schlagwörter

    Vignette de l'image.Illustration
    e) Anzeige im "Wöchentlichen Verzeichnis"

    Vignette de l'image.Illustration
    f) Anzeige im "Halbjahres-Verzichnis"

    Vignette de l'image.Illustration
    h) Zeichenverwendung bei der Deutschen Bibliographie

    1. Il n'est pas possible, dans ce rapport, de donner plus de détails. On les trouvera en consultant l'article de Rudolf Blum : Die maschinelle Herstellung der Deutschen Bibliographie in bibliothekarischer Sicht, in : Zeitschrift für Biblioihekswesen und Bibliographie, 1966, 5/6, pp. 303-321. retour au texte

    2. Au cours de la deuxième quinzaine de septembre 1966. retour au texte

    3. ...rouge retour au texte