
Jean-François Blanchette est professeur émérite au Department of Information studies de l’Université de Californie à Los Angeles et responsable scientifique du diplôme d'établissement "Gouvernance responsable des données" à l'Enssib.
1/ Pouvez-vous vous présenter en quelques mots ?
J’ai une formation résolument hybride : j’ai commencé par des études en informatique, avec une licence et une maîtrise, avant de me tourner vers les sciences sociales pour un doctorat en anthropologie des sciences et technologies. Avant de rejoindre l’Enssib, j’ai passé vingt ans aux États-Unis, où j’étais enseignant-chercheur à l’Université de Californie à Los Angeles (UCLA), dans le département qu’ils appellent là-bas « information studies » ou « school of information ». On y forme des bibliothécaires, des archivistes, des experts en sciences de l’information, des historiens du livre et aussi des doctorants. C’est très proche de ce qu’on fait ici à l’Enssib, ce qui m’a permis de m’y sentir tout de suite à ma place !
Mes recherches et mes cours se sont surtout concentrés sur trois sujets qui me passionnent : l’évolution des documents électroniques, l’archivistique numérique et la gouvernance des données.
2/ Pourriez-vous définir le concept de gouvernance responsable des données ?
Les données aujourd’hui structurent nos déplacements, nos interactions, nos choix de consommation, nos soins de santé, et plus encore. Mais cette intégration croissante dans notre quotidien soulève des questions cruciales : comment s’assurer qu’elles sont fiables, éviter les effets inattendus, en tirer les bénéfices qui justifient les nouveaux risques? La gouvernance responsable des données, c’est fournir aux institutions un cadre clair pour les gérer de manière réfléchie, en tenant compte à la fois des besoins techniques, des opportunités qu’elles offrent, et des risques qu’elles peuvent engendrer.
Pour simplifier la réponse, je vais séparer les deux notions : la « gouvernance des données » d’un côté et le « responsable » de l’autre, un aspect qu’on a choisi d’ajouter à l’Enssib. C’est cette dimension de responsabilité qui fait toute la différence dans notre approche par rapport à ce qu’on voit ailleurs.
a) Gouvernance des données
On réduit souvent la gouvernance des données à une simple liste de règles à suivre : on s’assure de bien cocher les cases des réglementations à respecter et le tour est joué! Mais en réalité, c’est un travail beaucoup plus vaste, où l’on met en place un cadre global qui permet de gérer les données tout au long de leur cycle de vie, du moment de leur création jusqu’à ce qu’on les élimine. Ce cadre inclut des règles, des processus, et des responsabilités pour s’assurer que chaque étape du cycle de vie est prise en charge correctement et efficacement. Le cycle de vie de la donnée, cela inclut entre autres:
- La capture : c’est ce qui transforme un phénomène ou une observation en une donnée. En gros, c’est là que tout commence.
- Ensuite, il y a la mise en forme : ici, on organise la donnée pour qu’elle soit utilisable. On parle de structuration dans des schémas ou des ontologies, et on ajoute des métadonnées – ces fameuses données sur la donnée. Ça peut être quelque chose de basique comme une date ou beaucoup plus complexe, comme des droits de propriété intellectuelle.
- En bout de ligne, il y la préservation : on conserve la donnée sur le long terme, comme patrimoine de l’institution ou bien encore comme preuve, ou bien on l’élimine.
La gouvernance, c’est s’assurer que l’organisation a les outils, les ressources, et les bonnes pratiques pour que chaque étape soit effectuée correctement. En d’autres termes, elle fournit le cadre et les processus qui garantissent que les données restent utilisables, sécurisées et pertinentes à chaque moment de leur cycle de vie. Par exemple:
- Respecter les obligations réglementaires : il peut s’agir de protéger la vie privée, ou bien d’assurer la transparence de l’institution face au public.
- Partager les données : avec l’Open Data, le but est de rendre les données disponibles à d’autres, comme des chercheurs qui pourraient les réutiliser.
- Assurer la fiabilité des données: il faut s’assurer que les données soient de bonne qualité, cohérentes et à jour. Cela passe entre autres par la traçabilité : savoir d’où elles viennent et comment elles ont été manipulées, pour pouvoir les utiliser en toute confiance.
- Standardiser les formats : pour que les données puissent circuler facilement entre différentes institutions. Pensez par exemple aux données de la SNCF ou de la RATP utilisées sur des plateformes comme Google Maps.
Si ce cadre et ces processus ne sont pas en place, les données auront beaucoup de mal à atteindre leur plein potentiel. Et à l’inverse, bien gérées, les données peuvent permettre d’enrichir les services proposés, de révéler des opportunités inexploitées au sein des institutions.
En pratique, les institutions ne partent pas toutes du même point : certaines sont déjà bien rodées, d’autres tâtonnent encore. Et c’est là qu’intervient le rôle clé de la personne chargée de la gouvernance des données : c’est elle qui va accompagner l’institution pour qu’elle progresse et tire le meilleur parti de ses données.
b) L’aspect responsable
À l’Enssib, on a voulu ajouter une couche importante à la gouvernance des données : celle de la responsabilité. Cet aspect responsable s’inscrit dans une logique qu’on connaît bien ici en Europe, avec la responsabilité sociale des entreprises, un concept bien encadré chez nous. C’est un peu différent en Amérique, où ce genre de démarche repose surtout sur la pression sociale et l’envie des entreprises de soigner leur image.
En France, l’idée de responsabilité numérique a été portée par France Stratégie, un « think thank » gouvernemental. Cela englobe bien sûr la question environnementale, comme par exemple la durée de vie des appareils électroniques et notre capacité à les réparer. Mais c’est aussi plus large. Cela touche à toutes les questions sociétales liées à la gestion des données, comme la vie privée ou la transparence des institutions. Enfin, ça inclut l’idée que les établissements d’enseignement, comme le nôtre, ont un rôle à jouer pour intégrer ces enjeux dans leurs formations.
Le rapport de France Stratégie le souligne, la conformité réglementaire, c’est seulement la base, le strict minimum ! Ce qu’il faut, c’est une vraie gestion des risques, qui prenne en compte les attentes de toutes les parties concernées : les utilisateurs des services, les décideurs institutionnels, mais aussi les groupes impactés indirectement. Et c’est là que ça se complique. Les possibilités et les risques associés aux données ne sont pas donnés d’avance, on les découvre à mesure.
Si on prend l’exemple concret et familier de Doctolib, plateforme devenue incontournable pour prendre des rendez-vous médicaux. Il y a bien sûr les enjeux liés à la confidentialité des informations personnelles, mais ce n’est pas tout. On parle ici d’une situation de quasi-monopole d’un acteur privé dans un secteur d’intérêt public. D’autres problématiques se posent, comme les biais algorithmiques : par exemple, comment la plateforme décide-t-elle quels médecins sont mis en avant ? Il y a aussi des débats autour de l’accès pour les professionnels de santé alternative, de l’interopérabilité des données entre systèmes, ou encore de la tarification équitable pour les praticiens. Bref, tout ça montre bien à quel point la gouvernance responsable des données est bien plus large que la seule conformité réglementaire.
Dans le cadre de la formation, on décline cet aspect plus large de responsabilité autour de trois grandes thématiques:
- Les rapports de force : qui gagne, qui perd ?
Les données, ça change les règles du jeu entre différents groupes. Prenons Doctolib : les patients ont aujourd’hui beaucoup plus d’informations pour choisir leur médecin, ce qui leur donne un certain pouvoir. Mais les médecins eux doivent s’adapter à une nouvelle dynamique où la plateforme et ses caractéristiques jouent un rôle central. Ces dynamiques ont bien sûr des implications éthiques mais aussi stratégiques, parce qu’elles vont générer toutes sortes de conflits. L’approche responsable va tâcher d’identifier ces déséquilibres et les conflits qu’ils vont engendrer, et agir en connaissance de cause. - Anticiper le futur : entre pessimisme et utopie
Quand on pense à l’avenir du numérique, les points de vue sont souvent très contrastés. Certains considèrent que les données vont mener à une société de contrôle déshumanisée, gouvernée par les algorithmes. D’autres sont plus centrés sur les opportunités pour les outils comme les données ouvertes de transformer positivement nos pratiques et nos institutions. Quelle que soit notre inclination personnelle, une réalité s’impose dans les deux cas: l’utilisation des données ne s’impose pas toujours facilement, et le rythme de leur adoption varie énormément selon les contextes.
Par exemple, si on planifie aujourd’hui tous nos déplacements grâce à notre téléphone, Doctolib n’a explosé que parce que la pandémie a rendu la téléconsultation indispensable. De même, si les organismes subventionnaires comme l’ANR exigent le dépôt de données de recherche, il y a concrètement très peu de réutilisation de ces données. L’anticipation responsable, c’est être capable de voir les risques, les opportunités et les obstacles spécifiques à chaque domaine, et de planifier une stratégie en conséquence. - L’utilisation des ressources: à quel prix les données?
Gérer des données, c’est mobiliser des ressources sur plusieurs fronts : par exemple, des infrastructures informatiques complexes et coûteuses, plus ou moins vertes ; des compétences humaines précieuses, qu’il s’agisse d’ingénieurs, d’analystes, ou de gestionnaires ; des processus de maintenance : les données vieillissent parce que les normes et les outils évoluent. Les adapter pour qu’elles restent pertinentes représente un effort constant, souvent sous-estimé, avec un coût conséquent. L’utilisation responsable des ressources, c’est faire des choix pour équilibrer coûts, efforts humains, durabilité, impact environnemental.
En résumé, l’approche responsable, telle qu’on la conçoit à l’Enssib, est essentielle pour être réellement performant dans la gestion des données. Comprendre les rapports de force, anticiper les risques, et gérer les ressources de manière réfléchie ne sont pas des options : ce sont des conditions indispensables pour élaborer des stratégies efficaces et durables. Cette approche ne se limite pas à des principes éthiques abstraits, elle vise également à fournir aux professionnels des outils concrets pour répondre aux enjeux spécifiques de leur domaine.
3/ Pourquoi choisir le diplôme d’établissement de l'Enssib pour se former à la gouvernance responsable des données ?
Pour l’Enssib, proposer ce diplôme est une suite logique, très naturelle. Les compétences nécessaires pour travailler dans la gouvernance des données sont, en fait, très proches de ce que l’Enssib enseigne depuis toujours. Depuis des décennies, notre École s’intéresse à des missions comme organiser, structurer et préserver l’information – que ce soit dans les bibliothèques ou les archives. Ces savoir-faire sont plus actuels que jamais : ils s’appliquent directement à la gestion des données numériques.
Notre héritage intellectuel nous donne une base solide pour explorer en profondeur tout le cycle de vie des données, un élément fondamental qu’on a déjà évoqué. Par exemple, quand on parle de structurer les données, on s’appuie sur tout ce qui a été développé autour du catalogage ou de la description des documents. La diffusion des données ? C’est directement inspiré des pratiques de partage et d’accès aux connaissances en bibliothèques. Et pour la pérennité des données, on se base sur des réflexions venues du monde des archives, où on sait depuis longtemps comment conserver l’information sur le long terme. En plus de ces compétences techniques, cet héritage intellectuel est accompagné d’une réflexion riche, de tradition humaniste, sur des sujets comme la littératie, la liberté d’expression, le droit d’auteur, la mémoire ou encore, la preuve documentaire.
C’est exactement cette double approche que nous voulons transmettre. Former des experts, oui, mais des experts qui savent aussi réfléchir sur les données, sur leurs usages et leurs implications. Ça permet d’aller plus loin, de trouver des façons créatives de travailler avec les données, pour améliorer des pratiques déjà en place, ou pour répondre à des besoins nouveaux qui émergent. Parce que mieux comprendre les données, c’est souvent ce qui ouvre la porte à des solutions auxquelles on n’avait pas encore pensé.
4/ A qui s'adresse ce diplôme, quels en sont les débouchés ?
C’est un domaine encore jeune, et dans beaucoup d’institutions, il y a déjà des gens qui font de la gouvernance des données sans même en avoir le titre ou une formation spécifique. Notre objectif, c’est de donner un cadre clair à leur travail, de reconnaître leur expertise par le biais d’un diplôme, et de l’encadrer. On veut aussi aider les salariés qui s’intéressent aux données et qui aimeraient développer leurs compétences pour vraiment s’investir dans ce domaine.
Le diplôme ouvrira ses portes à la rentrée de l’automne 2025. Il comprend 304 heures de formation réparties d’octobre à juin, avec un format mixte adapté à la réalité des professionnels en poste. Une partie se fait en distanciel : 24 semaines à raison de 3 heures par semaine. Et l’autre partie se déroule en présentiel, avec 4 semaines intensives sur le campus de l’Enssib, en octobre, janvier, mars et juin. Enfin, en mai, les participants réaliseront un stage professionnel d’un mois au sein d’un service public ou privé.
Cette formation s’adresse aux professionnels déjà en poste qui veulent allier innovation par les données et responsabilité numérique. Elle est pensée pour les managers, les professionnels des données, les spécialistes en documentation, archives et bibliothèques, ou encore les chefs de projets numériques. Ça inclut également les acteurs du service public et du privé qui travaillent avec des données ouvertes, ainsi que tous ceux qui souhaitent développer une expertise sur les enjeux stratégiques liés à la gestion, l’exploitation et la valorisation des données.
La gestion des données est devenue une nécessité, que ce soit dans les entreprises ou dans les institutions publiques. Avec l’explosion des volumes et la complexité croissante des usages, il ne s’agit pas seulement de les traiter, mais aussi de les comprendre et d’en anticiper les évolutions. C’est ce que ce diplôme vise à transmettre : une combinaison de compétences techniques et une capacité à réfléchir aux enjeux plus larges des données. Nous souhaitons former des professionnels capables de s’adapter à un domaine en constante transformation, en gardant toujours une vision critique et des outils adaptés pour faire face aux défis de demain.
Consultez l’ensemble des publics visés par le diplôme d’établissement en gouvernance responsable des données proposé par l’Enssib, ses débouchés, le calendrier des candidatures et modalités d’admission.
Propos recueillis par Robin Chauchot
Le 15 janvier 2025