Trouver

Rechercher des données devient une pratique de plus en plus courante dans l’ensemble des disciplines pour aborder une nouvelle question de recherche. Le mouvement de la Science ouverte et la mise à disposition des données publiques (open data) favorisent la diffusion des données en accès libre et ouvert et leur réutilisation par les communautés de recherche.

Rechercher des données en open data ?

Les données en open data sont des données auxquelles l’accès est totalement libre et gratuit, de même que l’exploitation et la réutilisation. « Il existe un certain nombre de principes fondamentaux associés à la notion d’open data et un certain nombre de textes législatifs en France et en Europe qui réglementent ou impactent la gestion des données de la recherche et la réutilisation des informations publiques. Parmi ces textes, figurent principalement la Loi Valter (2015) et la Loi pour une République Numérique (2016) qui toutes deux élargissent le champ d’application de la Loi CADA et ont pour objectif de favoriser la réutilisation de l’information publique. » Voir Guide de bonnes pratiques Atelier Données (CNRS) – 1. Imaginer et préparer

Parmi les données de l’open data, on trouve les données de la recherche, assimilées à des données publiques.

Afin de trouver des données, deux démarches peuvent être entreprises :

  • Rechercher des données publiques au sein de plateformes, qui partagent en accès libre et ouvert, des données administratives, publiques, les données en open data.
  • Rechercher des données de recherche, associées ou non à des publications, grâce à des moteurs de recherche ou directement au sein d’entrepôts de données.

La recherche de données publiées permet d’envisager de nouvelles perspectives de recherche en établissant son corpus et la méthodologie de collecte de ses données.

Pour en savoir plus :

 

Rechercher des données publiques (open data)

Rechercher des données publiques depuis les portails européens ou plateformes françaises :

Portail des données ouvertes européennes

https://data.europa.eu/

Plateforme ouverte des données publiques françaises

https://www.data.gouv.fr/fr/

Autres plateformes maintenues par Etalab (transports, données géographiques, cadastre, entreprises et associations de France, etc.)

https://www.etalab.gouv.fr/plateformes

Il existe aussi de nombreux portails thématiques, comme :

On trouve leur équivalent à l’étranger, comme :

  • Les données publiques canadiennes
  • Les données ouvertes du Royaume-Uni
  • Open data pour la ville de New York
  • Liste de nombreux portails open data dans le monde
Rechercher des données de la statistique publique

De nombreuses données d’enquêtes de la statistique publique sont accessibles sur demande sur le site Quetelet-Progedo-Diffusion, notamment les données de l’ADISP (enquêtes de l’INSEE), de l’INED, du CDSP (Centre de Données Socio-Politiques) et du CASD (Centre d’Accès Sécurisé aux données)

 A l’exception des données du CASD dont l’accès est très règlementé, la grande majorité de ces données sont accessibles sous simple condition d’inscription et de présentation d’un projet de recherche. 

Pour toute question sur les données de la statistique publique et les données d’enquête, contacter la Plateforme Universitaire de Données (PUD) des Grands Moulins via recherche.dbm[a]listes.u-paris.fr

Rechercher des données de recherche (open research data)

Pour identifier des entrepôts ou jeux de données, il est conseillé de passer par des méta-moteurs. Le tableau suivant présente une sélection de moteurs de recherche d’entrepôts de données ou de jeux de données directement :

Registry of Research Data Repositories, un répertoire international qui permet de rechercher des entrepôts de données

Re3data

OpenAIRE permet de rechercher des publications et des données issues pour l’essentiel de projets financés par l’UE

OpenAire|Explore

Dataset Search, le moteur de recherche de données de Google, permet de rechercher des jeux de données

Dataset Search

DataCite propose un moteur de recherche recensant tous les jeux de données ayant bénéficié d’un DOI

DataCite

Elsevier a mis en place l’outil DataSearch pour rechercher différents types de données

MendeleyData

Une fois l’entrepôt identifié, l’utilisation de filtres ou de la recherche avancée permet de préciser sa recherche au sein des collections du réservoir et d’optimiser la possibilité de trouver un jeu de données pertinent pour son projet.

En santé, les bases de données médico-administratives, les registres et les cohortes dans le domaine de la santé constituent des outils de référence pour la recherche épidémiologique et en santé publique. À retrouver ici sur le site de l’INSERM. Voir aussi le Health Data Hub.

Pour aller plus loin :

Pour toute question : donnees.recherche.dbm[a]listes.u-paris.fr

À lire aussi

HALathon-Santé : du 2 au 12 mai 2023

HALathon-Santé : du 2 au 12 mai 2023

    HALathon : principes et fonctionnement Depuis son ouverture en octobre 2020, l’archive ouverte HAL UPCité s’est progressivement enrichie et contient aujourd’hui plus de 100 000 références et 67 000 documents en texte intégral. L’objectif est de mener,...

Dernière mise à jour : 
JJ/MM/AAAA