Données de Recherche

On appelle données de la recherche (DR) l’ensemble des informations collectées, observées ou créées, sous une forme numérique ou non, par les équipes de recherche dans le cadre d’un projet de recherche.

Les données de recherche sont des informations à partir desquelles sont bâties les hypothèses. Produit de la recherche, elles sont un élément de communication scientifique et regroupent un ensemble hétéroclite de sources et matériaux de recherche.

Communément, elles sont définies fonction de leur niveau d’élaboration :

Les données dites « chaudes » 
 
Données brutes : collectées, non organisées, non mises en forme.
Données traitées : organisées, structurées et prêtes à être analysées.
Les données dites « froides »Données analysées : achevées, elles permettent de produire les publications, rédiger sa thèse..., et seront archivées pour leur éventuelle réutilisation.

Les données de la recherche sont des éléments concrets dont la communauté scientifique admet communément la nécessité pour documenter et valider les résultats de recherche.

Elles concernent, en plus des métiers de la recherche, les métiers qui viennent en appui à celle-ci (la documentation, les archives, l’informatique, l’information scientifique et technique, ...).

Chacun de ces métiers joue un rôle essentiel dans le cycle de vie des données.

Que veut dire « gérer ses données » ?

La gestion de données de recherche correspond à l’ensemble des opérations de collecte, description, stockage, traitement et accès aux données produites au cours d’un projet de recherche. Elle couvre le cycle de vie complet du projet et au-delà : création, diffusion, conservation des données, dans la perspective de leur pérennisation et/ou de leur réutilisation. La gestion des données fait partie du processus de recherche. Les porteurs de projet ont une responsabilité particulière vis-à-vis de leur institution et de l’agence qui finance leurs recherches.

Assurer la qualité des données, leur archivage et leur partage est une exigence des bailleurs publics qui souvent conditionnent le financement de projets de recherche à l’ouverture des données, à leur mise en accès libre et gratuit.

Pour faire simple, cela consiste à :

  • accompagner vos données tout au long du cycle de vie du projet de recherche (création, traitement, analyse, partage et réutilisation) ;
  • les organiser dès la collecte ;
  • sauvegarder régulièrement les données en cours d’utilisation (dites « chaudes ») ;
  • préserver/archiver les données immuables (dites « froides »), et rendre leur lecture accessible et leur exploitation future possible ;
  • respecter les règles éthiques pour leur partage.

Cycle de vie des données

Le cycle de vie des données est l’ensemble des étapes de gestion, de conservation et de diffusion des données de recherche, associées aux activités de recherche.

Il comporte globalement 6 étapes :

  1. planification
  2. création / collecte
  3. traitement / analyse
  4. accès / partage
  5. préservation
  6. réutilisation

 

 

Plan de Gestion des Données PGD ou DMP Data Management Plan

La gestion des données de recherche est facilitée par la réalisation d’un plan de gestion de données, PGD - ou Data Management Plan, DMP.

Un plan de gestion de données est un document formel expliquant la façon dont vous obtenez, documentez, analysez et utilisez vos données au cours de votre recherche et une fois le projet terminé. Il décrit dans le détail les méthodes et processus de création, de fourniture, de maintenance, de conservation et de protection des données.

Depuis 2019 ce livrable est exigé par les financeurs (nationaux, européens). Il conditionne le paiement du solde et permet de notifier l’ensemble des moyens mis en œuvre pour assurer la gestion des données utilisées.

La rédaction du plan de gestion des données commence à se généraliser, au delà des projets financés. Preuve en est le Décret n° 2021-1572 du 3 décembre 2021 relatif au respect des exigences de l’intégrité scientifique par les établissements publics y consacre son article 6.

    […] Les établissements publics et fondations reconnues d'utilité publique mentionnés au troisième alinéa de l’article L. 211-2 du code de la recherche définissent une politique de conservation, de communication et de réutilisation des résultats bruts des travaux scientifiques menés en son sein. A cet effet, ils veillent à la mise en œuvre par leur personnel de plans de gestion de données et contribue aux infrastructures qui permettent la conservation, la communication et la réutilisation des données et des codes sources.[…]

Il permet de :

  • fiabiliser les données et faciliter leur gestion ;
  • anticiper et favoriser leur éventuelle diffusion ;
  • décrire la façon dont les données scientifiques d’un projet de recherche seront produites, traitées, diffusées, protégées...

En résumé :

  • Le DMP spécifie quelles données sont collectées ou générées, comment celles-ci sont gérées, partagées et préservées pendant et après le projet.
  • C’est LA bonne pratique pour tout projet de recherche générant des données.
  • Il est exigé par les organismes de financement et aux établissements publics.
  • Il s’agit d’un outil concret de gestion de projet.
Contact

Francine Filoche
Chargée de mission Données de recherche
Service commun de documentation
francine.FILOCHE@univ-amu.fr

Pour contacter toute l’équipe : scd-science-ouverte@univ-amu.fr

Pour se connecter au Guichet de la Donnée du site d'Aix-Marseille : GDsAM

Pour contacter l'équipe du GDsAM: Gdsam-contact@groupes.renater.fr

Mots-clés
données
science ouverte
plan de gestion des données
data management plan
DMP
PGD