17 — 23 janvier 2016
Qu'est ce que la Donnée ?

Le thème des Journées de Rochebrune change tous les ans. Pour sa 23e édition, Rochebrune se consacre aux données.

Les données sont au cœur du processus scientifique. Elles servent tantôt à formuler des hypothèses (abduction), à affiner les hypothèses (induction) et à infirmer ou confirmer les hypothèses (déduction). Traces de phénomènes passés, présents ou à venir, il est naturel et nécessaire de les associer à tous les moments de la construction de la connaissance scientifique. Les données revêtent alors une importance capitale dans l’élaboration de la science moderne.

Poser la question des données c’est aussi s’interroger sur leur qualité, leur accessibilité, leur coûts voire leurs utilisations. Ces questions renvoient à d’autres problèmes, comme celui de leur élaboration et de leur acquisition.

Pourtant la nature des données, leur statut épistémologique demeure la source d’un questionnement constant tant du point de vue de leur création, que de leur utilisation ou de leur partage ; que sont les données, comment dépasser leur limites, leurs imprécisions, comment en disposer d’assez sans en avoir trop, comment les échanger et les transmettre, comment les décrire et les modéliser, comment les simuler, ou plus simplement comment travailler avec des données. Ces questions s’expriment plus encore face à des objets remarquables tels que les système complexes, dont le comportement nous est, par définition, inconnu et dont la frontière entre le phénomène et le contexte demeure floue. Les données y sont alors tour-à-tour source de connaissance mais aussi de doute ou d'erreur, marque indélébile de notre ignorance

Face à ces nombreuses interrogations qui transcendent les disciplines et les objets d’études, les 23e journées de Rochebrune 2016 ont pour objectifs de dresser les contours d’une réflexions sur les données dans les systèmes complexes naturels et artificielles et à travers ce prisme d’étendre la question de la nature des données en science.

L'inscription définitive se fait sur le site du CIRAD, notre support administratif, vous allez y être redirigé

* Dernière minute, il reste quelques places, venez profiter d'une conférence exceptionnelle *

Appel à Contributions
et Ateliers

Vos contributions en deux temps

Vos contributions seront invitées à être publiées dans un numéro spécial de la nouvelle revue internationale JIMIS : Journal of Interdisciplinary Methodologies and Issues in Science.

Des ateliers pratiques

  • Atelier 1 : captation et manipulation de données sur internet - Fabien Pfaender
  • Atelier 2 : modélisation d’un problème pour la simulation - Jean-Pierre Muller
  • Atelier 3 : Bibliométrie et représentation - David Chavalarias
  • Atelier 4 : Analyse des microblogs et geovisualisation - David et Fabien
  • Atelier 5 : Éthique des données - Daniele Bourcier

Les ateliers proposent une découverte pratique des méthodes et outils simples et puissants pour capter/analyser/modéliser/visualiser des données. Leur durée est fixée à 2h. Ils ne sont pas obligatoires.

Axes de réflexions possibles

Pour interroger la question des données, les contributions pourront s’inspirer des axes de réflexions non exhaustifs suivants

  • Définition des Données — les données sont utilisées tantôt comme des traces d'un phénomène, des donnés, des informations, des connaissances voire des preuves. En anglais, « data » est pluriel si ce sont des faits, singulier si ce sont des informations. Quel est alors la nature des données, leur définition, de quoi leur statut dépend-il, existe-t-il des règles d’usage communément admises, comment se construit le dialogue scientifique dans ce pluralisme de sens.
  • Données et Méthodes — travaille-t-on avec les même méthodes suivant si les données sont captés, construites ou produites ou transmises ? Les données ne sont jamais "pures", elles sont toujours le fruit d'un processus qui les a mises à disposition des sens d'une manière ou d'une autre. Dans ce cadre, doit-on tenir des modes d’acquisition dans les méthodologies, et si oui comment en tenir compte ? Commence-t-on toujours par avoir des données avant de modéliser ou bien peut-on procéder / amorcer le travail du scientifique sans données à priori ?
  • Données et Métadonnées — toute donnée qui quantifie ou qualifie un phénomène peut à son tour faire l’objet constituer une nouvelle trace exprimée par d’autres données qui deviennent alors des méta données, ou données à propos des données. Quel est le statut des méta données. le niveau méta peut-il lui même être expliqué par des « méta méta » données, le « méta » est-il à invariance d’échelle ?
  • Digital et Analogique — données numériques ou données analogiques. Depuis le début des années 1990 Nous faisons face à une l’avalanche de données numériques mais aussi à la résurgence de capteurs physiques notamment via le phénomène fablab/hackerspace qui favorisent les données analogiques. Quelles sont les différences entre ces données, Comment passer de l’un à l’autre ?
  • Small Data / Large Data / Big Data — les incontournables big data sont à la mode mais s’agit-il vraiment de la révolution annoncée ou d’une simple évolution de nos pratiques. Ce terme d’ordinaire réservé à l’informatique contamine les autres disciplines qui se voient alors affubler du qualificatif « quantitative » (Sociologie quantitative, biologie quantitative, etc). Ainsi l’affluence de données transforment-elle les disciplines et dans un perspective à plus long terme les formations à ces disciplines ? Comment Big Data interagissent-elles avec les plus jeux de données plus modestes souvent plus précis ou comportant plus de variables ? les big Data sont-elles l’avenir et doit-on pour autant oublier les pratiques Small Data.
  • Données et corrélation — les données dont elles dépendantes ou indépendante des disciplines/chercheurs qui les utilisent / créent / récoltes. Elles peuvent avoir une valeur scientifique, économique, épistémologique dans les systèmes complexe mais jusqu’où peut-on se fier aux données, quelles précautions prendre et comment prendre ces précautions. Tout se réduit-il à p < 0,05 ?
  • Abondance de données — il est courant d'être à court de données ou d'en avoir trop peu. Mais en avoir trop peut-il aussi être un obstacle au travail scientifique, affectant à la fois l'imagination et le pouvoir déductif ?
  • Vrai positif, faux positif, vrai négatif, faux négatif — comment démêler le vrai du faux dans les données. La quantité de donnée est-elle un remède à leur imprécision ou incertitude. Comment se prémunir de ces obstacles lorsque les données sont corrélés de manière non linéaire.

Des contributions/sujets qui transcendent les disciplines : quelques pistes d'interrogations

  • En géographie comme en urbanisme, la question contemporaine des données se caractérise par une incroyable expansion des données disponibles et mobilisables permettant de décrire villes et espaces, du fait de l’avènement des données numériques. L’apparition de bases de données géo-codées de plus en plus nombreuses et souvent de plus en plus en plus spécifiques ont relancé l’intérêt de la discipline et de ses acquis face aux autres sciences – pour autant, cette expansion des données a-t-elle conduit à une expansion similaire de la connaissance ? Notamment, ces disciplines oeuvrent dans des secteurs où la complexité des processus en place, la multiplicité des acteurs, de leurs comportements pas tous forcément réductibles au rationnel, et de leurs interactions génèrent à la fois une multitude d’informations et de signaux et en même temps une grande imprévisibilité. Quel rôle, dans ce contexte, les données, en tant que traceurs des tendances prises, et/ou qu’indicateurs des niveaux des variables impliquées, peuvent- elles avoir dans la compréhension des phénomènes ?

  • Cette problématique s’applique à l’ensemble des sciences humaines et sociales. En informatique, tout est données mais celles-ci ne prennent sens que par rapport aux traitements qui leur sont appliqués. Sur le plan applicatif, l’OpenData soulève des questions profondes sur le sens même des données que l’on met à disposition. Se pose donc la question de l’interaction entre le sens des données et leur opérationnalisation procédurale. En représentation des connaissances, c’est le statut épistémologique de ces données qui est posé.

  • La donnée, dans les disciplines extrêmement formelles que sont la physique théorique et les mathématiques, ainsi que l'informatique théorique, trouve, dans les dernières théories généralisatrices, telle la théorie de l'information, un statut nouveau et recentré. En effet, dans la continuité des travaux de thermodynamique statistique de Bolztman, Shannon en formulant sa théorie, initialement très pragmatique, a, en réalité, permit de conférer à la donnée, un rôle critique et central. Plus exactement, il a été démontré, en re-visitant la théorie de Shannon, que l'acte le plus coûteux (en termes thermodynamique) de l'Univers, n'est rien d'autre que l'effacement d'une donnée! Cette approche, pourtant hautement théorique et mathématique, s'impose pourtant à l'informatique dans ce qu'elle a de plus pratique, immédiat et quotidien. De la même façon, sans tordre exagérément les concepts et les idées, ce statut augmenté de la donnée rejoint le concept d'événement de Einstein, Cohen-Tannoudji et de Hawking. La question se pose donc des liens entre évènements, observation et mesure de ces événements et donnée. Peut-il y avoir perception des événements de l'Univers, du niveau macroscopique à l'échelle quantique, sans production de données ? Enfin, ce que l'on nomme entropie et rupture de symétrie trouve-t-elles leurs racines dans ces effacements de données ?

  • En littérature, en musicologie et en histoire on est amené le plus souvent à utiliser des données du passé inscrites sur des médias variés. Que se soient des ouvrages, des partitions, des enregistrements, ou des toute autre forme de média, leur conditions de conservation et l'absence de numérique sont un challenge scientifique dès lors que l'on parle de données. En outre la très grande variété de données nécessaire, comme ce qui concerne le contexte d'écriture, les commentaires des auteurs, la situation géopolitique et culturelle d'alors, éclairent l'usage des données d'un angle nouveau pour une société devenue numérique. Les analyses synchroniques et diachroniques, l'herméneutique, changent le statut même des données en les contextualisant. Jusqu'où ce contexte doit-il être considéré ? Comme travailler avec des données en quantité quand les moyens même de leur conservation sont un problème en soi ? Dans le cas de la musique, les données elle-même peuvent être des interfaces vers des données originales qui n'existent plus (une partition est une écriture d'une oeuvre sonore dont le son est différent dans les conditions modernes). Comment être certain que les données d'observation issues de l'interface correspondent aux données sonores ou audiovisuelles d'alors bien que lu/vu/entendu avec des technologies modernes ?

  • En biologie ou en éthologie, comment travailler avec des phénomènes difficiles à isoler par nature ? Comment disposer de suffisamment de données pour étudier efficacement des organismes vivants intégrés à des écosystèmes parfois extrêmement étendue et en interaction constante tout en respectant un processus scientifique contraignant ? Quelle est, dans ces cas singuliers, la relation entre la donnée et la construction de la preuve ?

  • Ces quelques exemples ne sont évidemment pas exhaustifs et les contribution en droit, économie, philosophie, chimie, mécanique, statistiques, etc., seraient plus que bienvenues. Nous sommes impatient de découvrir vos contributions pour enrichir un dialogue scientifique ouvert et sérieux qui fait l'essence de Rochebrune depuis toujours.
À Propos de Rochebrune

Une Conférence / atelier / École d'Hiver Interdisciplinaire

Hors de toutes contraintes institutionnelles, Rochebrune est le lieu du doute et du questionnement de nos pratiques scientifiques en prise avec les systèmes complexes du physique au social, naturels ou artificiels. C’est, de ce fait, un lieu privilégié du dialogue interdisciplinaire qui permet à chacun d’ouvrir ses perspectives en interaction soutenue avec les autres.

Qui prend le temps

Rochebrune mélange de nombreux moments propices aux échanges dans le cadre de la conférence ou de ses abords. Les présentations des travaux de recherche font l’objet d’une discussion approfondie (et animé) avec l'ensemble des participants. Les ateliers pratiques sur le thèmes des données proposeront des solutions ou méthodes pratiques pour la manipulation, visualisation et modélisation des données.

Dans un Lieu Unique

Dans un chalet de haute montagne du ministère de l'agriculture, votre inscription (650€) comprend une pension complète au chalet de Rochebrune du 17 au 23 Janvier 2016