Recommandations

Les données de la recherche constituent l’un des trois piliers de la Science ouverte. Leur gestion, dans le contexte de l’ouverture par défaut des données publiques, représente un enjeu essentiel.  Collecte, protection, stockage et archivage, diffusion et valorisation des données s’appuient sur de nombreuses recommandations. Cliquez sur + à côté du pilier Données pour connaitre les engagements et les actions clefs de la feuille de route pour la Science ouverte d’Université Paris Cité.

Données de recherche, jeu de données : de quoi parle-t-on ?

Les données de la recherche ne sont pas aisées à définir et font l’objet de définitions variées. Selon l’OCDE, elles sont définies comme : « des enregistrements factuels (chiffres, textes, images, sons) utilisés comme source principales pour la recherche scientifique et généralement reconnus par la communauté scientifique comme nécessaires pour valider les résultats de la recherche ». Photographies, images satellitaires, schémas ou dessins, relevés météorologiques, enregistrements sonores… en font partie. Mais les cahiers de laboratoires, les analyses préliminaires, les projets de recherche, les échantillons de laboratoire, les communications personnelles… n’entrent pas dans la catégorie.

Pour l’Association des archivistes français, les données de la recherche sont : « des informations, spécimens et matériaux produits, recueillis et documentés. Elles sont collectées ou exploitées à des fins de recherche et de preuves par les chercheurs et leurs équipes. À ce titre, elles constituent une partie des archives de la recherche. »

In fine, on peut qualifier de données l’ensemble des matériaux collectés ou produits pour répondre à une question de recherche. Les données sont généralement regroupées sous la forme d’un jeu de données. Il peut être défini « comme l’agrégation sous une forme lisible, de données brutes ou dérivées présentant une certaine “unité”, rassemblées pour former un ensemble cohérent » (voir De l’Open data à l’Open research data : quelle(s) politique(s) pour les données de recherche ?).

Depuis une vingtaine d’années, des lois et directives invitent d’une part à rendre accessible au plus grand nombre les données publiques, y compris les données de la recherche, ainsi qu’à organiser leur gestion grâce à la mise en place d’un plan de gestion de données ou le respect des principes FAIR.

Pour aller plus loin :

Le cycle de vie des données

La gestion des données peut être envisagée en suivant leur cycle de vie résumée dans le schéma ci-dessous. Le cycle de vie comprend six étapes : création ou collecte des données, traitement des données, analyse, conservation, accès aux données, réutilisation. Le plan de gestion de données permet de réfléchir en amont du projet à l’ensemble de ces paramètres, ainsi qu’à la protection des données sensibles.

Pour aller plus loin :

 

Les principes FAIR

Les principes FAIR (Faciles à trouver, Accessibles, Interopérables et Réutilisables) interviennent à différents moment du cycle de vie afin de guider la stratégie de gestion des données, depuis la production jusqu’à la publication et diffusion des données. Définis en 2016 dans Scientific Data, cet acronyme définit les principes directeurs d’un partage de données facile à trouver, accessibles, interopérables et réutilisables. Leur application passe par la mise en place et le respect de certaines recommandations (métadonnées de qualité, présence d’identifiant pérenne lors du dépôt d’un jeu de données, etc.). Les principes FAIR n’impliquent pas l’ouverture systématique des données de la recherche. Le principe de base « aussi ouvert que possible, aussi fermé que nécessaire » reste en vigueur y compris lorsque l’on applique les principes FAIR.

Pour aller plus loin :

Protéger les données sensibles et personnelles

Gérer ses données implique également de réfléchir le plus en amont possible à la collecte de ses données et à la protection des données sensibles le cas échéant. Entré en vigueur le 25 mai 2018 dans toute l’Union européenne, le Règlement général sur la protection des données (RGPD) instaure un nouveau cadre juridique pour la protection des données personnelles.

Si votre projet, prévoit la collecte et l’utilisation de données à caractère personnel, contacter le Délégué à la Protection des Données (DPD ou DPO pour Data Protection Officer) désigné pour l’UMR (DPD de l’une des tutelles) avant toute opération de collecte de données.

  • Le traitement de données à caractère personnel doit été déclaré dans le registre des activités de traitement tenu par le DPD
  • Si la collecte des données repose sur le consentement des personnes, les modalités de recueil et de gestion du consentement au cours du projet de recherche doivent être précisées (possibilité de se rétracter et de sortir du champ de l’étude)
  • Les moyens pour informer les personnes concernées du traitement de leurs données, ainsi que les modalités d’exercice des droits des personnes concernées doivent être détaillées.
  • Ainsi que, les mesures techniques et organisationnelles pour garantir la confidentialité et la sécurité des données (techniques de pseudonymisation, chiffrement des données, etc.)
  • La réalisation d’une analyse d’impact sur la protection des données (AIPD) pour le traitement de données très sensibles, en lien avec le DPD, précisant les risques encourus et les mesures mises en œuvre pour protéger ces données

Contact : dpo[a]u-paris.fr

Pour aller plus loin :

À lire aussi

HALathon-Santé : du 2 au 12 mai 2023

HALathon-Santé : du 2 au 12 mai 2023

    HALathon : principes et fonctionnement Depuis son ouverture en octobre 2020, l’archive ouverte HAL UPCité s’est progressivement enrichie et contient aujourd’hui plus de 100 000 références et 67 000 documents en texte intégral. L’objectif est de mener,...

Dernière mise à jour : 
06/01/2022