Une métadonnée est une donnée (information) servant à définir ou décrire une autre donnée quel que soit son support (papier ou électronique).
Les métadonnées vont vous aider à localiser, comprendre et interpréter les données. Elles sont indispensables dans la gestion de vos données notamment pour la rédaction du plan de gestion des données (PGD) et aussi pour leur partage.
Les métadonnées permettent de décrire les caractéristiques telles que :
- Par qui et quand les données ont été créées
- Pourquoi et comment elles ont été générées
Les métadonnées facilitent la préservation des données numériques alors que les outils de diffusion (logiciels et formats) évoluent. Il convient donc de rendre les données et leur description stables dans le temps et de les faire reposer sur des normes et des standards.
Les standards des métadonnées
Le standard a pour objectif de fournir un ensemble d’éléments caractéristiques qui permettent de décrire les productions scientifiques. Le standard est choisi en fonction de la destination des données, dépôt, publication, archivage, etc. Il peut aussi être spécialisé par discipline, par type de données, etc., ainsi que son vocabulaire.
Exemples :
- Dublin Core (interdisciplinaire), description des ressources numériques
- Darwin Core (DwC), domaine de la biodiversité.
- Ecological Metadata Language (EML), sciences de l’environnement
- Data Documentation Initiative (DDI), domaine des sciences sociales, comportementales et économiques.
Les formats d’échange
Le format est une représentation sous forme numérique du standard et des métadonnées associées. Il est possible de parler de convention ou d’encodage. Cela permet l’utilisation de logiciels de représentation et de traitement des métadonnées et autorise des protocoles d’échanges.
Deux formats courants sont le XML et le CSV.
Pour plus d’information : site DoRANuM.
La Cellule Data Grenoble Alpes (sos-data[@]univ-grenoble-alpes.fr) est à votre disposition pour vous aider à identifier les bonnes modalités de description et à décrire vos jeux de données.