La création de l'Institut de l'information scientifique et technique (INIST) en 1988, partait de la volonté du ministère de la Recherche de développer, en France, un centre multidisciplinaire de fabrication de bases de données associé à un centre de fourniture de documents pour la diffusion de l'information scien- tifique et technique, d'abord pour les chercheurs français, mais également au service des chercheurs européens et dans le monde.
Pour cela, il fut décidé de mettre en œuvre les moyens technologiques les plus modernes. A chaque stade de la production d'information, une techno- logie spécifique a été adaptée et a été intégrée dans le système général d'in- formation, depuis l'acquisition des do- cuments jusqu'à la fabrication des bases de données PASCAL pour la science, la technologie et la médecine et Francis pour les sciences humaines et sociales, et à la gestion de la fourniture de do- cuments primaires.
La chaîne de production de l'INIST est divisée en plusieurs systèmes qui jalon- nent les étapes de transformation de l'information :
L'INIST a été membre de deux projets européens : TRANSDOC et ADONIS. De ces deux expériences, il est résulté un projet opérationnel : le Système d'archi- vage numérique (SAN). Du projet TRANS- DOC (1984-1986), l'INIST a retenu que le transfert par satellite des textes numéri- sés était difficile à mettre au point et coûteux, mais que les techniques de nu- mérisation image et de stockage sur dis- que optique numérique étaient maîtrisa- bles à un coût raisonnable.
Du projet ADONIS, l'INIST a retenu que la technique de numérisation a priori et intégrale des textes devait se gérer facilement en association avec la base de données.
L'INIST a choisi 1 800 périodiques (sur son fonds de 27 000 titres) pour être nu- mérisés systématiquement. Ces titres ont été choisis parmi les titres les plus demandés en fourniture de documents et représentent donc les périodiques cœurs de la littérature internationale.
Si l'on considère que la demande de do- cuments est, pour une moitié, extrême- ment dispersée (sur les titres et les an- nées) et pour l'autre moitié concentrée sur un peu plus de 5 000 titres, il était logique de prendre parmi ces derniers, les titres dont on sait d'avance que cha- que fascicule est sollicité pour la four- niture de documents.
En dehors du défi technique que cela représentait en 1990, la numérisation permettait de résoudre simultanément plusieurs problèmes :
La numérisation est effectuée en mode image selon les normes recommandées par le groupe international sur l'échange de documents électroniques (GEDI), dont l'INIST est membre : une résolution de 300 BPI, l'organisation des fichiers en format TIFF et la compres- sion des images en groupe IV CCITT.
La société Jouve qui effectue la numé- risation des 90 fascicules par jour, trie les documents en fonction des pro- blèmes de qualité :
Les images sont copiées sur des disques optiques numériques ATG double face qui contiennent 70 000 pages. Les dis- ques sont chargés sur un juke-box (CY- GNET) qui contient 131 disques, muni de 2 lecteurs de disques (ATG 60001). Le système est géré par un ordinateur SUN 4/370 (sous ORACLE/UNIX) qui communique avec le système de four- niture de documents sur un IBM 9121 par l'intermédiaire d'un réseau local ETHERNET.
Trois micro-ordinateurs permettent la transmission des documents sur les ré- seaux de télécommunication en fax groupe IV ou groupe III. De la réception de la demande à l'INIST à la réception du document chez l'utilisateur, quel- ques minutes suffisent, et sans interven- tion humaine.
L'INIST traite environ 600 000 demandes de fourniture de documents par an, ac- tivité anuelle en progression d'environ 8 %. Pour assurer ce service avec des délais courts (2 heures, 24 heures ou 48 heures selon le niveau de service de- mandé), l'INIST a informatisé la gestion des commandes.
Les clients de l'INIST peuvent utiliser différents moyens de commande :
L'INIST a également développé des pro- cédures de transfert de fichiers à partir du système du client ou à partir d'une grille de saisie formatée sur un poste de travail, ou enfin à partir d'une sélec- tion de références bibliographiques capturées sur les CD-ROM Pascal. Les protocoles de communication adoptés permettent un accès par les réseaux de la recherche en messagerie électroni- que ou avec FTP sur TCP/IP (type IN- TERNET) ou par le RNIS avec STUTEL.
L'INIST reçoit encore beaucoup de commandes sous forme non électroni- que : formulaires papier, fax, coups de téléphone.
Toutes les informations sont, dans ces cas, saisies dans le système pour que toutes les commandes soient gérées électroniquement.
Le système trie les commandes selon la cote en magasin des documents et adresse les commandes aux bons étages de magasin où elles sont imprimées pour traitement. Le Système d'archivage numérique (SAN) est le magasin priori- taire. Toutes les demandes portant sur des documents numérisés lui sont adres- sées. Ce n'est qu'en cas de panne qu'un reroutage dans les magasins est prévu.
Pour les documents numérisés, le SAN traite les commandes par lots, toutes les deux heures. C'est l'équilibre actuel en- tre la nécessité de grouper les de- mandes par adresse physique sur les disques et la nécessité d'une réponse rapide au client.
Pour tout problème de référence in- complète ou ambiguë, le système ou les magasiniers adressent l'enregistrement au fichier d'un service spécialisé dans l'iden- tification et la localisation des documents.
L'INIST travaille en coopération avec 100 bibliothèques de recours pour ob- tenir les documents qu'il ne possède pas. La localisation de certains de ces documents est faite dans le fichier INIST qui est conçu comme un catalogue col- lectif interne pour permettre une orien- tation externe automatique.
La saisie des éléments de fabrication (nombre de pages) sert d'indication de fin de traitement.
La fourniture de documents se fait de plus en plus sous forme électronique. Mais cette forme électronique est prin- cipalement du mode image. Ce mode permet de transmettre des documents dont l'origine est sous forme papier, mais ses gros inconvénients sont :
C'est pourtant sur cette base que travail- lent l'INIST et ses partenaires européens dans le projet EDIL (Electronic Document Interchange between Libraries) auquel des bibliothèques universitaires vont par- ticiper. C'est aussi selon ces mêmes tech- niques que sont présentés les documents du projet TULIP avec l'éditeur Elsevier ou Right Pages de Springer Verlag, pour ne citer que ceux-là.
Déjà de nouveaux projets de distribu- tion des documents en mode caractères, en particulier en normes SGML commencent à voir le jour. L'INIST et le ministère de l'Enseignement supérieur et de la Recherche y sont attentifs car c'est la voie de l'avenir. Des expé- riences appliquées à la littérature grise permettront de rendre opérationnelle une chaîne de diffusion électronique.
L'accès au texte intégral et l'augmenta- tion considérable de la puissance des systèmes de recherche documentaire vont bouleverser l'approche que nous avions jusqu'alors à la fois de la re- cherche documentaire dans les bases de données bibliographiques et de la four- niture de documents.
Les bases de données bibliographiques devront évoluer très vite pour ne pas devenir obsolètes par la concurrence de l'accès direct au texte intégral. L'INIST, à la fois producteur de bases de don- nées et centre national de fourniture de documents, est bien placé pour appré- cier tous les éléments du problème et saura les intégrer pour que de la convergence du signalement biblio- graphique et du document primaire naissent de nouveaux produits plus ef- ficaces et adaptés à l'attente du public.