Data Science et Machine Learning pour la recherche, une introduction
Résumé de la formation
Vous êtes Doctorant et vous travaillez avec l’analyse de données ou vous désirez découvrir Python pour la data science et le traitement des données, cette formation est faite pour vous.
Quatre jours intensifs pour acquérir les bases de l’utilisation du langage Python pour des applications en analyse de données, data minning et data science.
Après une introduction au langage python (ou un rappel si vous avez déjà utilisé python), vous apprendrez à maîtriser les bibliothèques spécialisées.
Basée sur de nombreux exercices pratiques, cette formation vous permet d’être immédiatement opérationnel pour le traitement de vos données.
Programme
Jour 1
- Introduction au langage Python
- Anaconda et Jupyter comme outils pour l’analyses
- Le langage (la syntaxe, les structures (string, listes, dictionnaires…), les opérateurs et les fonctions)
- Les classes, les objets et la création de bibliothèques
- Python pour le traitement des données
- Le processus de développement d’un outil en python pour la data science
- Cas pratique.
Jour 2
- L’importation des données (texte, csv, Excel)
- La préparation et le nettoyage des données (jointure, filtre, transformation, traitement des données manquantes avec pandas, numpy et scipy)
- La data visualisation
- Présentation des principes de la data visualisation
- Quelques graphiques simples avec matplotlib : scatter plot, box plot, histogrammes…
- Introduction à la machine Learning : présentation des principes de l’apprentissage automatique
- Cas Practique
Jour 3
- Préparation des données avec la bibliothèque scikit-learn
- Cas pratiques en machine learning
- L’extraction d’informations pertinentes
- Value estimation
- Arbres de décision
- Cas pratique
Jour 4
- Cas pratique de principe à fin.
- Discussions et démonstrations de fonctionnalités avec les problématiques des participants
Formateurs et formatrices
Eulalio TORRES, Docteur en Ingénierie Aérospatiale avec trajectoire internationale et expérience dans l’analyse des données en plusieurs secteurs.
Informations pratiques
• Email (contact pédagogique) : ingetorresg@gmail.com
• Dates prévisionnelles : 04, 05, 06, 07 avril 2022 de 9h à 16h
• Lieu : à distance
• Durée : 4 jours/ 24h
• Pré-requis : Bases de statistiques sont recommandées mais pas obligatoires. Ordinateur et envie d’apprendre.
• Public visé : Doctorants
• Effectif maximum : 20
Code
OUN18
Public
Doctorants
Durée
4 jours/ 24h
Langue
Français
Format
Distanciel
Formations dans la même catégorie
Advanced Applied Data Analytics
Langue : Anglais
Format : Distanciel
Code : DFONAA
Applied Data Analytics
Langue : Anglais
Format : Distanciel
Code : DFONADA
Zotero : Modifier un style
Langue : Français
Format : Distanciel
Code : OUN01
Enseigner dans un environnement numérique
Langue : Français
Format : Presentiel
Code : DFEP3
Elaborer sa recherche à l’aide d’outils numériques
Langue : Français
Format : Presentiel
Code : DFOM5
Zotero : prise en main complète
Langue : Français
Format : Distanciel / Présentiel
Code : OUN10
Zotero : niveau avancé
Langue : Français
Format : Distanciel
Code : OUN11
Pratique de l’ordinateur et d’Internet pour doctorants
Langue : Français
Format : Présentiel
Code : OUN14