Il est important d’anticiper la gestion des données de la recherche afin de faciliter les différentes étapes de la vie des données. C’est l’un des objectifs du plan de gestion des données.
Ne prenez pas l’établissement d’un plan de gestion des données comme une contrainte administrative de plus, mais plutôt comme un outil destiné à vous aider à planifier votre projet.
En particulier, réfléchir à un PGD permet de répondre à des questions très pratiques :
- Quelles données vont être produites / traitées pendant ce projet ?
- Quel en sera le volume ?
- Y aura-t-il peu de gros fichiers ou de nombreux petits fichiers ?
- Quels seront les types des données, sous quels formats seront-elles stockées ?
- Comment les partager entre les différents membres du projet ?
- Où les stocker, les sauvegarder ?
- Quels seront les besoins de traitements et d’analyse ? Sur quelles infrastructures ?
Un point pratique est de définir au sein du projet de bonnes pratiques d’organisation des données.
Un autre point essentiel est de se mettre d’accord sur le format des fichiers à utiliser, d’une part pour la bonne marche du projet, et d’autre part dans l’optique d’une réutilisation ultérieure plus facile de ces données (dans le cadre du projet, d’une suite du projet ou de la valorisation des données en open data).
Il est possible d’anticiper le coût induit par la gestion des données à court et long terme (cet aspect peut être intégré à une demande de financement de type ANR). Plusieurs outils permettent d’évaluer ces coûts.
- Data Management costing tool (université de Delft) : cet outil se présente sous la forme d’une check list dataillant les coûts possibles aux différentes étapes du cycle de vie des données (collecte, nettoyage, etc;).
Il s’inspire du guide proposé par UK Data Service. - EPFL Library Cost Calculator for Data Management : cet outil de calcul prend en compte les coûts d’infrastructures (serveur de stoclage, cahiers de laboratoire électroniques, bases de données, entrepôts de données, archivage à long terme, etc) sur toute la durée du projet.
Dès la phase de montage d’un projet et lors de la rédaction de la proposition détaillée, le guide Faire entrer la science ouverte dans son projet ANR : un guide pratique édité par le GTSO (Groupe de Travail Science Ouverte ) Données de Couperin, facilite la prise en compte de la gestion des données dans le projet.
L’UGA recommande la rédaction de plans de gestion des données (PGD) pour tout travail de recherche, notamment pour les projets de thèse des doctorants. L’établissement l’exige pour tous les projets qu’il finance.
Le Décret sur l’intégrité scientifique (article 6) indique que les établissement “définissent une politique de conservation, de communication et de réutilisation des résultats bruts des travaux scientifiques”. Ils doivent veiller “à la mise en œuvre par leur personnel de plans de gestion de données”.
Dans ce cadre, la Cellule Data Grenoble Alpes propose un accompagnement personnalisé dès le montage des projets en lien étroit avec l’unité de service ingénierie de projets et l’équipe HAL UGA.