Utiliser des données de la statistique publique comme données de cadrage pour sa thèse en SHS
Résumé de la formation
La statistique publique française et européenne développée depuis la seconde moitié du XXe siècle comporte de nos jours une vaste palette de jeux de données d’enquête, de recensement, mais aussi de données administratives, qui couvrent la plupart des champs d’étude des Sciences Humaines et Sociales. Chaque sujet de recherche porte sur une population, un territoire, et il est utile pour le raisonnement et la démonstration scientifique de pouvoir les situer dans un ensemble plus vaste ou d’en préciser les effectifs.
Objectifs de la formation
Cette formation est destinée à un public de doctorant·e·s en SHS peu ou pas familier des méthodes quantitatives. Elle vise à donner les outils nécessaires à l’utilisation des données publiques disponibles, en tant que données de cadrage, de contexte, pour des projets de recherche en SHS. Il s’agira dans un premier temps de montrer la variété et les opportunités qui existent aujourd’hui d’utilisation de données issues de la statistique publique ou des administrations, ainsi que de permettre à chaque doctorant·e de trouver des données intéressantes pour illustrer son travail de thèse. Dans un second temps seront enseignés les éléments théoriques et pratiques élémentaires de la statistique descriptive, dans un environnement logiciel adapté à de l’initiation (tableur…). Le troisième volet de la formation portera sur la représentation graphique et – dans une moindre mesure pour les données qui le permettent – cartographique d’analyses descriptives menées avec des données publiques. A la fin de la formation, les doctorants seront en mesure de comprendre l’intérêt de l’utilisation de données publiques comme données de cadrage pour leur travail de thèse, et d’utiliser des outils simples à cet effet.
Programme
Séance 1 (4h) : Présentation du paysage de la statistique publique
- La TGIR Progedo et le réseau des PUD : accompagner et promouvoir l’usage des enquêtes de la statistique publique
- Paysage de la statistique publique Française et internationale
- Application : recherche de données de cadrage pour sa thèse (Quételet-Progedo-Diffusion…) et accès aux données (Quételet, en open access, etc.).
Séance 2 (4h) : Initiation à la statistique descriptive
- Eléments de base de la théorie statistique (statistique descriptive, notions de statistique inférentielle, etc.)
- Manipulations essentielles : importation, conversion de format, sélection, fusion, agrégation…
- Application : exercices sur un logiciel type tableur (statistique descriptive, formules, tableaux croisés, etc.)
Séance 3 (4h) : Représenter des données statistiques et des analyses descriptives
- Représentations graphiques sur un logiciel type tableur : histogrammes, courbes, pyramide des âges, etc…
- Principes élémentaires de la représentation cartographique de données localisées avec le logiciel Magrit : données localisées disponibles (data.gouv, INSEE, etc.), fonds de cartes, sémiologie graphique, numériser sa propre carte avec Phil Digit, etc.
Formateurs et formatrices
- Charlotte Dion (Ingénieure de la Plateforme Universitaire des Grands Moulins, Centre des Humanités Numériques & TGIR PROGEDO)
Informations pratiques
Dates : 30 mai, 6 juin et 13 juin 2024 de 14h à 18h en présentiel à la bibliothèque des Grands Moulins. La première séance est obligatoire, mais peut être suivie à distance sur demande. Les deux autres séances sont facultatives (approfondissement).
Public
Doctorants en SHS
Durée
12h
Contact
formation.dbm@listes.u-paris.fr
Langue
Français
Format
Présentiel
Code
HUN14
Formations dans la même catégorie
Visualiser des données en humanités numériques
Langue : français
Format : distanciel
Code : HUN10
Transcrire des documents avec Transkribus
Langue : français
Format : distanciel
Code : HUN9
Faire de la fouille de données et de l’apprentissage automatique avec WEKA
Langue : français
Format : distanciel
Code : HUN8
Faire des humanités numériques hier et aujourd’hui
Langue : français
Format : distanciel
Code : HUN7
Valoriser la recherche avec les Data Papers
Langue : français
Format : distanciel
Code : REV19
Science ouverte : webinaire introductif
Langue : Français
Format : Distanciel
Code : SCO10
Règles et bonnes pratiques pour une recherche conforme au RGPD
Langue : Français
Format : Distanciel
Code : GST67
Veille informationnelle et connaissance des réseaux sociaux de la recherche en psychologie
Langue : Français
Format : Distanciel
Code : GST52