Au sein du département scientifique « Sciences pour l’action, les transitions, les territoires »  d’INRAE, des spécialistes de la qualité des données (chantier QualiNous) d’une part et du règlement général sur la protection des données (RGPD) d’autre part, se sont associés pour créer une affiche qui permet d’appréhender le cycle de vie des données en vue d’améliorer la gestion, la mise en qualité et l’ouverture des données de la recherche :

Veronique Batifol, Laurent Burnel, Aurélie Cardona, François Johany. Affiche « Cycle de vie des données : un outil pour améliorer la gestion, la mise en qualité et l’ouverture des données ». 2021, ⟨10.15454/hsc3-b796⟩⟨hal-03204351⟩

 

FooSIN a souhaité partager avec vous cette affiche qui met les principes FAIR au cœur de la démarche de la gestion et de la réutilisation des données. A destination des agents INRAE, les recommandations font certes références à des ressources qui leur sont réservées mais peuvent être source d’inspiration pour tous.

Cette affiche a pour objectif de permettre aux producteurs et gestionnaires de données :

  1. D’appréhender le cycle de vie des données, comme un processus pendant lequel une ou plusieurs personnes interagissent avec les données, de leur création à la publication jusqu’à leur réutilisation ultérieure ;
  2. De repérer les différentes étapes clés de la gestion/mise en qualité/ouverture des données tout au long d’un projet de recherche ;
  3. D’identifier un certain nombre d’outils et de ressources associés aux différentes étapes du cycle de vie pour aider à la gestion des données de la recherche, leur mise en qualité et ouverture. Cette ouverture pouvant se faire dans différents périmètres : du partage dans le collectif du projet jusqu’à l’open data ;
  4. D’identifier pour les données à caractère personnel (DCP) un certain nombre d’actions à mettre en place pour garantir leur mise en conformité avec le Règlement Général pour la Protection des Données (RGPD).

En complément des recommandations faites par les auteurs, FooSIN suggère aux gestionnaires de données qui souhaitent mieux répondre aux principes FAIR d’utiliser :

  • des standards reconnus par leur communauté pour représenter les données, éventuellement des ontologies ;
  • des vocabulaires contrôlés pour les valeurs de propriété ;
  • des catalogues et entrepôts qui mettent en œuvre des schémas de métadonnées standards et les web services permettant de les exploiter.

Ces types de ressources permettent de clarifier voire d’expliciter de manière formelle la sémantique des données et des métadonnées, facilitant ainsi leur découverte (F) et leur réutilisation (R). Pour agir sur l’interopérabilité (I) entre deux jeux de données, deux scénarios possibles :

  • utiliser les mêmes schémas de données et/ou de métadonnées
  • déclarer des correspondances (alignements) entre les schémas de données et/ou de métadonnées utilisés respectivement

Des catalogues comme FAIRsharing, RDA Metadata Directory, Agroportal, Bioportal, etc. permettent de choisir ce type de ressources partagées pour les réutiliser.