Le PGD (Plan de Gestion des Données) ou DMP (Data Management Plan) est un document initié en amont du travail de recherche et qui évolue tout au long du projet.

Il aide à la conception d’un projet en se posant, dès son montage, un certain nombre de questions sur les bonnes pratiques de gestion des données tout au long du cycle de vie.

  • Qui seront les personnes responsables de la gestion des données ?
  • Quels types de données vont être créés ou collectés ? Par quelles méthodes ?
  • Comment seront organisées les données ?
  • Comment seront décrites les données ? Quel volume vont-elles occuper ?
  • Comment et où seront-elles stockées, sauvegardées ? Seront-elles sécurisées ?
  • Dans quel cadre légal seront-elles accessibles, réutilisables ?
  • Sous quelles conditions seront-elles partagées ?
  • Sont-elles soumises au RGPD ? Doit-on les anonymiser ?
  • Des moyens humains et financiers seront-ils nécessaires pour la gestion de ces données ?

Les réflexions face à ces questions permettent de documenter la manière dont les données vont être produites ou collectées, décrites, traitées, partagées, protégées et conservées pendant et après le projet de recherche et ceci pour chaque jeu de données.

Le chercheur peut être accompagné sur un certain nombre de points par d’autres acteurs – informaticiens, juristes, DPO, IST …

La rédaction du PGD peut être une volonté et/ou une obligation, par exemple pour un projet finançé par l’ANR c’est un premier livrable à 6 mois. Il est de plus en plus exigé par les financeurs de projet et recommandé par certains organismes de recherche. Sa rédaction est un élément clef pour produire des données FAIR.

De nombreux modèles sont disponibles pour faciliter sa rédaction, le choix se fait selon les exigences d’un financeur ou d’une institution, une thématique de recherche ou son envie et ses besoins.

Il est possible d’anticiper le coût induit par la gestion des données à court et long terme (cet aspect peut être intégré à une demande de financement de type ANR). Plusieurs outils permettent d’évaluer ces coûts :

  • Data Management costing tool  (université de Delft) : cet outil se présente sous la forme d’une check-list dataillant les coûts possibles aux différentes étapes du cycle de vie des données (collecte, nettoyage, etc;).
    Il s’inspire du guide proposé par UK Data Service
  • EPFL Library Cost Calculator for Data Management : cet outil de calcul prend en compte les coûts d’infrastructures (serveur de stoclage, cahiers de laboratoire électroniques, bases de données, entrepôts de données, archivage à long terme, etc) sur toute la durée du projet.

Ressources disponibles