Séminaire

Les données à mille temps

Organisateur : Enssib

Responsable : Agnieszka Tona

Date et horaire : 20/05/2022 10:30 - 13:00

Adresse : Enssib, Amphithéâtre | 17/21 boulevard du 11 novembre 1918 | 69100 Villeurbanne

Retour à l'agenda
seminaire data
Présentation de l’évènement

Intitulée « Le temps comme clé d'intelligibilité de la donnée ... », cette séance est structurée autour d'un positionnement épistémologique qui invite à prendre plus au sérieux le temps, ou plutôt, qui invite tout simplement le temps, dans la compréhension de ce que sont les données.

Dans ce cadre d'idée, la donnée ne se comprend que comme « étant » dans le temps et qu'à partir du temps, en particulier du temps présent (seul moment où elle peut être saisie par notre attention). Si la donnée se déploie à partir du présent, qui détermine son mode d'existence et permet de la faire exister présentement dans nos consciences, quels sont ses autres rapports avec le temps et ses trois zones temporelles :  le passé, le présent et le futur ? De quelle manière est-elle présente ? S'ancre-t-elle dans le flux du temps et ses trois temporalités ? Permet-elle de retourner vers le passé, l'acheminer vers le présent, le représenter, et même le projeter vers l'avenir ? Ou peut-être existe-t-elle hors du temps et échappe ainsi à son passage ? Voici quelques questions que cette séance nous permettra de creuser, en s'appuyant essentiellement sur des exemples de documents audiovisuels.  

 

Programme

 

  • 10h30Introduction, Agnieszka Tona, maître de conférences en SIC, Enssib
  • 10h50 – « Abstraction par les données et le numérique : vers un présentisme des contenus ? », Bruno Bachimont, professeur, Unité de recherche Costech, Université de technologie de Compiègne, Alliance Sorbonne Université.
    Les données sont, contrairement à ce qu'on dit souvent, ont une dénomination qui leur convient fort bien. Simplement, au lieu d'être des données qui nous seraient données, dans leur transparence à l'origine, dans une authenticité sans biais, elles sont plutôt ce que l'on se donne, ce que l'on décrète et instaure en vue de la réalisation d'une tâche ou la résolution d'un problème. La donnée, dès lors, n'a pas de passé, car elle est décrétée, et pas d'avenir au-delà du traitement qui lui sera imposé. Sans histoire qui les auraient produites et sédimentées, elles ne sont donc pas des traces, et ne deviendront pas non plus des traces, car elles ne laisseront rien au-delà des calculs effectués.
    Les données numériques résultent donc d'une double abstraction, celle vis-à-vis de la matière physique qui permet de ne considérer qu'un code, celle de la mise en donnée qui permet de ne retenir qu'un format de manipulation. Cette indépendance au passé et à l'avenir issue de cette double abstraction a évidemment une importance et un intérêt considérables, car cela permet d'aborder des calculs n'importe où, n'importe quand, sur n'importe quoi. Mais la tension sera extrême quand les calculs devront porter sur des contenus emprunts d'histoire, lourds de sens, contingents dans leur matérialité.
    On peut alors s'interroger sur ce que pourrait produire le présentisme de la donnée et du support numérique sur des documents patrimoniaux, par exemple des archives audiovisuelles. Comment montrer un passé révolu sur un support qui ne passe pas ? Comment faire ressentir un sens, un goût de l'archive avec des donnés qui n'ont pas de temps ? C'est l'une des questions centrales que rencontrent les médiations de contenus, quand elles doivent montrer une image qui n'est pas d'aujourd'hui dans son inactualité malgré l'actualité de son support virtuel et de ses données formalisées.
    Après avoir montré en quoi les données sont intemporelles et sont mobilisées via des formalisations qui ne le sont pas moins, nous nous interrogerons sur les possibilités de médiations de contenus patrimoniaux où le passage du temps et la perception du révolu sont au principe de ces contenus.
  • 11h50 – « Temps et document audiovisuel : représentation et calcul », Jean Carrive, docteur en informatique, responsable adjoint du Département Valorisation des collections à l'Institut national de l'audiovisuel (INA).
    La dimension temporelle des documents audiovisuels pris dans un sens assez large recouvrant la télévision, la radio, le cinéma et la musique présente des spécificités dont la notion de « données », pour temporelles qu'elles puissent être, peine à rendre compte. Les systèmes informatiques de représentation ou de calcul (dont les systèmes dits « d'intelligence artificielle ») qui cherchent à les formaliser ou les analyser parviennent tout au mieux à abaisser la tension dont parle Bruno Bachimont qui existe entre les manipulations possibles de leurs représentations numériques et leur contenu. Nous essaierons d'illustrer de manière concrète les tentatives faites en ce sens à l'Institut national de l'audiovisuel (INA) à travers la présentation d'une part de projets scientifiques qui mêlent recherche technologique et recherche en sciences humaines et sociales (projet ANTRACT par exemple (voir https://antract.hypotheses.org/), et d'autres part de projets plus opérationnels d'indexation automatique et d'aide à la documentation.