Stocker

Le stockage des jeux de données est une étape très importante du cycle de vie des données et intervient à différents moments au cours de la vie d’un projet. Le stockage des données intervient au cours du projet de recherche tandis que l’archivage à long terme ou la conservation pérenne intervient à la fin de ce dernier.

Où et quand déposer ses données ?

Le dépôt des données collectées ou réutilisées sur un espace de stockage se fait tout au long du projet. Il est recommandé d’utiliser un espace de stockage institutionnel du type :

  • NextCloud, cloud institutionnel d’Université Paris Cité adapté pour le stockage, le partage et le traitement de données légères de type tableurs ou fichiers texte ;
  • sDrive, pour les laboratoires rattachés au CNRS (suite collaborative avec espace jusqu’à 100 Go)
  • share, pour les laboratoires rattachés à l’INSERM.

A défaut, il existe des espaces de stockage disciplinaires. Par exemple, en sciences humaines et sociales, l’IR* Huma-Num propose ShareDocs aussi bien pour le personnel de l’ESR (90 Go) que pour des projets (300 Go).

En plus d’être sécurisés, de tels espaces de stockage procèdent à une sauvegarde régulière des jeux de données qui y sont déposés, ce qui implique que ceux-ci sont copiés sur un second support numérique, et donc peuvent être restaurés en cas de dégradation ou de perte.

Quel que soit l’espace de stockage que vous choisissez, il est conseillé d’adopter la règle du 3-2-1, c’est-à-dire, disposer de 3 copies de vos données :

  • Deux copies sur deux supports distincts (clé USB, ordinateur personnel ou disque dur).

  • Une copie hors site, par exemple sur un serveur ou un cloud.

Comment trier et archiver ses données ?

Toutes les données collectées, produites et réutilisées dans le cadre d’un projet de recherche ne sont pas à conserver indéfiniment. Un tri est donc à réaliser afin de distinguer les données à conserver des données à détruire en tenant compte des facteurs suivants :

  • l’intérêt historique  de vos données;

  • leur intérêt scientifique (réutilisation dans le cadre d’un autre projet ou pour valider des résultats) ;

  • la possibilité d’un recours juridique ;

  • leur encodage dans un format lisible ;

  • leur coût total;

  • la facilité à les régénérer.

De manière générale, vous devez conserver vos données de recherche, a minima, au moins le temps que dure votre projet de recherche. Certaines données, par contre, comme les données techniques ou les données d’enquête doivent être conservées au minimum une dizaine d’années. En cas de doute sur la durée et les modalités de conservation de vos données, vous pouvez consulter le département des Archives d’Université Paris Cité ou le référentiel de gestion des archives de la recherche.

En outre, spécifiquement pour les codes et logiciels, il existe Software Heritage, la plateforme internationale dédiée à la collecte, la préservation et le partage des codes sources.

Comment procéder si vous travaillez avec des données à caractère personnel ?

Si vous prévoyez de collecter ou d’utiliser des données à caractère personnel, contactez dès le début de votre projet le Délégué à la Protection des Données (DPO) désigné par votre structure de recherche (DPO de l’Université Paris Cité ou de l’un de vos tutelles).

Vous devez également envisager des mesures de sécurité complémentaires :

  • Respecter la charte informatique et/ou de la politique des systèmes d’information (PSSI) de l’établissement.

  • Attribuer des droits d’accès sécurisés à chaque membre de l’équipe de recherche.

  • Contrôler l’accès aux supports numériques contenant les données (authentification des utilisateurs et traçabilité des accès)

  • Protéger la sécurité des données, en utilisant par exemple un antivirus)

  • Contrôler l’intégrité des données (« journal des évènements sur les données », etc.)

  • Contrôler l’accès physique aux données (interphone, badge ou code d’accès aux locaux, lecteur biométrique, serrure, antivol, armoire fermée à clé).

  • Mettre en place le partage sécurisé à distance des fichiers entre les membres (chiffrement des fichiers lors des envois, utilisation d’un canal sécurisé de transfert/partage des fichiers comme FileSender).

  • Sécuriser vos données en les protégeant avec un mot de passe ou en les chiffrant.

  • Disposer de procédures de restauration des données en cas de perte de données (systèmes de sauvegardes pour restauration d’une précédente version des données, etc.).

Contact DPO UPCité : dpo[@]u-paris.fr

Liens utiles

Généralités sur le stockage

Archivage des donnés

À lire aussi

Dernière mise à jour : 
28/05/2025