Les principes FAIR intègrent, via la lettre R, la notion de ré-utilisabilité des données de la recherche.

Cette réutilisation ne peut exister que si les données entrent dans un cadre descriptif et organisationnel précis, et qu’elles sont mises à disposition de la communauté.

Le partage des données de la recherche a plusieurs objectifs :

  • en premier lieu, augmenter la visibilité de la recherche associée à ces données
  • assurer la reproductibilité des résultats scientifiques
  • favoriser de nouvelles collaborations
  • répondre aux exigences de nombreux financeurs et de certains éditeurs
  • permettre l’utilisation de ces données dans d’autres cadres disciplinaires

Pour autant, le partage des données doit se faire de manière raisonné : il ne s’agit pas de diffuser toutes ses données, tout de suite et n’importe comment.

D’abord, il faut évidemment respecter les règles associées aux données sensibles, toutes les données ne sont pas diffusables :

Aussi ouvertes que possible, aussi fermées que nécessaires.

Feuille de route du CNRS pour la science ouverte (18/11/2019)

Ensuite, deux notions sont importantes :

L’embargo est la période pendant laquelle les données de la recherche (déposées dans un entrepôt de données) ne sont pas accessibles librement. Par contre, les métadonnées associées doivent être accessibles pour signaler l’existence de ces données tout en préservant leur protection.

Il s’agit d’identifier comment partager ses données, et quel mode de diffusion choisir. Il existe de nombreux entrepôts de données disciplinaires, thématiques ou généralistes. Les données peuvent aussi être diffusées via des data papers. Enfin, certains éditeurs imposent la mise à disposition des données liées à une publication.

L’utilisation de données diffusées en open data, dans le cadre d’une nouvelle recherche, nécessite de citer précisément leur origine, au même titre qu’une publication :

  • créateur(s) des données
  • date de publication et version
  • nom du jeu de données
  • entrepôt de données hébergeur
  • identifiant unique (DOI) et éventuellement url