guides pratiques expliquant la méthodologie à mettre en oeuvre pour classer des jeux de données dans un portail open data

Question

Existe-t-il un ou plusieurs guides pratiques expliquant la méthodologie à mettre en oeuvre pour classer des jeux de données dans un portail open data ? 

Réponse

Date de la réponse :  17/11/2017

Si nous avons bien compris l'objet de votre question, vous êtes actuellement en train de recenser l'ensemble des jeux de données accessibles en ligne sur les plateformes open data. Votre objectif est ensuite de définir un modèle de classement de ces jeux de données permettant au public de retrouver rapidement les informations qu'il recherche. Vous proposeriez ensuite ce modèle de classement aux villes qui souhaitent développer un portail Open data.
Vous êtes à la recherche de guides pratiques s'appuyant sur une nomenclature permettant une indexation des jeux de données.

Vous avez déjà identifié ce document proposé par la BnF sur les pages de son site consacrées à l'indexation et à l'élaboration d'ontologies

Développement d'une ontologie 101 : guide pour la création de votre première ontologie. Natalya Fridman Noy, Deborah L. McGuinness. Stanford Knowledge Systems Laboratory Technical Report KSL-01-05, Stanford Medical Informatics Technical Report SMI-2001-0880, March 2001.

Nous n'avons pas réussi à identifier d'autres guides pratiques sur le sujet.
Voici cependant des documents qui pourront vous aider :

Nous vous invitons tout d'abord à consulter un document publié par le mouvement Opendata France intitulé Contribution pour le décret en vue de la publication des données rendues obligatoires aux collectivités dans le cadre de la loi NOTRe et qui indique (page 4) :

"Le catalogue des jeux de données :
Chaque portail de données dispose d’un catalogue des jeux de données publiées. Pour faciliter les recherches et les agrégations, il est recommandé d’utiliser un modèle normalisé, tel que celui préconisé par OpendataFrance ou utilisé par la plateforme Data.gouv.fr ou OpendataSoft."

Nous vous invitons à consulter aussi le site de Schema.org, organisme international qui travaille sur les normes standards pour structurer les vocabulaires sémantiques des ontologies. Il s'agit d'une instance collégiale, avec un fonctionnement collaboratif et communautaire, qui a pour mission de créer, maintenir et promouvoir des schémas pour des données structurées sur Internet.

Par ailleurs, comme l'indique la BnF, il existe un peu dans tous les domaines des créations d'ontologies pour construire le web sémantique.
Vous trouverez sur le blog Onyme une présentation générale de la notion d'ontologie.

Dans le secteur des bibliothèques et de la documentation, on utilise l'ontologie RDF adoptée avec le nouveau code de catalogage RDA (qui fonctionne sur un modèle conceptuel de description des données bibliographiques, appelé FRBR). Cette ontologie est une des plus répandues car elle est bien comprise par les machines web - mais il y en a d'autres (voir l'article Good ontologies. du wiki de W3C) et chaque secteur peut définir la sienne.

Vous serez peut être intéressé par l'ontologie développée par le site Datatourisme (Datatourisme : nous contacter).

Vous pourrez consulter également :

  • Practical ontologies for information professionnals. David Stuart. Facet Publishing, 2016.
    Vous trouverez à la fin de cet ouvrage une bibliographie présentant un grand nombre de documents en anglais.
  • Le web sémantique : comment lier les données et les schémas sur le web ? Fabien Gandon, Catherine Faron-Zucker, Olivier Corby. Dunod, 2012.
  • Knowledge organization and classification in international information retrieval. Haworth Information Press, 2003.
  • Indexing : from thesauri to the Semantic Web. Pierre de Keyser. Chandos, 2012.
  • Le mouvement « Open data » dans la grande transformation des intelligences collectives. Jean-Max Noyer, Maryse Carmes. Presses des Mines. Paris, 2014.

Vous trouverez peut être des informations pertinentes dans l'un des blogs suivants :

Vous pourriez également faire appel aux organismes suivants pour obtenir des conseils :