Indexation libre vs. indexation contrôlée

Attention, cette réponse est ancienne. Son contenu peut être en tout ou partie obsolète.

Question

Bonjour,
Existe-t-il des études récentes portant sur les avantages et inconvénients respectifs des indexations libre et contrôlée (voire sur leur nécessaire complémentarité) ?
Merci d'avance.

Réponse

Date de la réponse : 20/11/2015

Vous cherchez des études récentes sur les avantages, les inconvénients ou la nécessaire complémentarité des indexations libre et contrôlée.

L'article que vous indiquez avoir consulté (Indexation libre et contrôlée d’articles scientifiques) porte sur l'indexation automatique des documents, qui est à la frontière entre les sciences de l'information et le traitement automatique du langage, et relève plus de l'informatique.
Si votre question concerne cette approche de l'indexation (qui trouve de nombreuses applications bien au-delà du monde des bibliothèques), vous devrez consulter des études de niveau recherche, notamment en anglais.
Pour identifier les documents les plus pertinents dans ce vaste domaine, vous pouvez demander conseil à des chercheurs spécialistes ; par exemple les auteurs de l'article que vous signalez, qui animent l'atelier d'évaluation francophone en fouille de textes.
Pour une recherche plus générale :
- la base thèses.fr vous permettra d'identifier des thèses en français : voilà par exemple les résultats d'une recherche sur les mots clés "traitement automatique du langage indexation", depuis 2013.
- les bases de données scientifiques (souvent payantes) vous permettront d'identifier des articles ; pour une recherche dans le domaine des sciences de l'information, vous pouvez consulter à l'enssib les bases LISA - Library and Information Science Abstracts et LISTA - Library Information Science and Technology Abstracts with Full text.

Si votre question concerne l'indexation humaine (non automatique) pratiquée en bibliothèque, voilà quelques rappels :
Une indexation contrôlée repose sur un thesaurus, liste des termes choisis pour représenter les concepts et les sujets dont traite un document (on parle aussi de langage documentaire).
L’indexation libre ne repose pas sur un vocabulaire contrôlé. On parle de folksonomies pour désigner l'indexation communautaire (ou social bookmarking) sur le web à l’aide de mots-clés (ou «tags»). Actuellement, certaines bibliothèques développent des projets de crowdsourcing, qui peuvent comporter une dimension d'indexation collaborative.

Nos recherches ne nous ont pas permis d'identifier de documents récents portant précisément sur les avantages, les inconvénients ou la nécessaire complémentarité des indexations libre et contrôlée en bibliothèque. Mais ceci ne veut pas dire qu'il n'existe rien sur le sujet. Voilà les résultats de nos recherches :

Documents disponibles à la bibliothèque de l'enssib :
- Analyse et représentation documentaires : introduction à l'indexation, à la classification et à la condensation des documents. Michèle Hudon. Presses de l'Université du Québec, 2013
- Indexing from thesauri to the Semantic Web. Pierre de Keyser. Chandos, 2012

Documents disponibles en ligne :
- Indexation sociale et folksonomies : étude des principes d’organisation et de classement de l'information dans les bibliothèques 2.0. Anne Zemmour. mémoire de master 1. Université Grenoble 3, 2011
- Bibliothèques, tags et folksonomies. L'indexation des bibliothèques à l'ère sociale. Claire Lebreton. Mémoire d'étude de conservateur. enssib, 2008
- Folksonomies. Olivier Le Deuff. Bulletin des bibliothèques de France. 2006, n° 4, p. 66-70.

Enfin, en ce qui concerne les évolutions des catalogues en lien avec le web sémantique, le web de données et le linked data, vous pouvez consulter les travaux d'Emmanuelle Bermès ; celle-ci a notamment coordonné un manuel sur le sujet :
Le web sémantique en bibliothèque. Emmanuelle Bermès ; avec la collaboration d'Antoine Isaac et Gautier Poupeau. Éd. du Cercle de la librairie, 2013. Extrait, page 20 ("Que change le web") : "... le terme d'indexation, qui désignait en catalogage le fait d’associer à un document des mots issus d’un vocabulaire contrôlé pour en décrire le contenu (…) désigne en informatique l’extraction des contenus textuels des documents par les moteurs de recherche … »