Que sont les données de la recherche ?

Les données de la recherche sont définies comme des enregistrements factuels (chiffres, textes, images et sons), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider les résultats de la recherche. Un ensemble de données de recherche constitue une représentation systématique et partielle du sujet faisant l’objet de la recherche. Ce terme ne s’applique pas aux éléments suivants : carnets de laboratoire, analyses préliminaires et projets de documents scientifiques, programmes de travaux futurs, examens par les pairs, communications personnelles avec des collègues et objets matériels (par exemple, les échantillons de laboratoire, les souches bactériennes et les animaux de laboratoire tels que les souris).

Définition du Rapport OCDE 2007

Cette définition est assez restrictive et on peut élargir aux catégories suivantes (proposées par l’INIST – Institut de l’Information Scientifique et Technique du CNRS) :

  • Les données d’observation : données capturées en temps réel, habituellement uniques et donc impossibles à reproduire.
  • Les données expérimentales : données obtenues à partir d’équipements de laboratoire, qui sont souvent reproductibles mais parfois coûteuses.
  • Les données computationnelles ou de simulation : données générées par des modèles informatiques ou de simulation, souvent reproductibles si le modèle est correctement documenté.
  • Les données dérivées ou compilées : données issues du traitement ou de la combinaison de données “brutes”, elles sont souvent reproductibles mais coûteuses.
  • Les données de référence : collection ou accumulation de petits jeux de données qui ont été revus par les pairs, annotés et mis à disposition.

Les données de la recherche peuvent donc prendre des formes très variées : images, données numériques, textes, vidéos, codes sources, …

Cette vidéo aborde de nombreuses problématiques liées à la gestion des données d’un projet de recherche, n’hésitez pas à la regarder, en moins de 5 minutes vous comprendrez tous les enjeux !