Data Science et Machine Learning pour la recherche, une introduction

Résumé de la formation

Vous êtes Doctorant et vous travaillez avec l’analyse de données ou vous désirez découvrir Python pour la data science et le traitement des données, cette formation est faite pour vous.
Quatre jours intensifs pour acquérir les bases de l’utilisation du langage Python pour des applications en analyse de données, data minning et data science.
Après une introduction au langage python (ou un rappel si vous avez déjà utilisé python), vous apprendrez à maîtriser les bibliothèques spécialisées.
Basée sur de nombreux exercices pratiques, cette formation vous permet d’être immédiatement opérationnel pour le traitement de vos données.

Programme

Jour 1

  • Introduction au langage Python
  • Anaconda et Jupyter comme outils pour l’analyses
  • Le langage (la syntaxe, les structures (string, listes, dictionnaires…), les opérateurs et les fonctions)
  • Les classes, les objets et la création de bibliothèques
  • Python pour le traitement des données
  • Le processus de développement d’un outil en python pour la data science
  • Cas pratique.

Jour 2 

  • L’importation des données (texte, csv, Excel)
  • La préparation et le nettoyage des données (jointure, filtre, transformation, traitement des données manquantes avec pandas, numpy et scipy)
  • La data visualisation
  • Présentation des principes de la data visualisation
  • Quelques graphiques simples avec matplotlib : scatter plot, box plot, histogrammes…
  • Introduction à la machine Learning : présentation des principes de l’apprentissage automatique
  • Cas Practique

Jour 3

  • Préparation des données avec la bibliothèque scikit-learn
  • Cas pratiques en machine learning
  • L’extraction d’informations pertinentes
  • Value estimation
  • Arbres de décision
  • Cas pratique

Jour 4

  • Cas pratique de principe à fin.
  • Discussions et démonstrations de fonctionnalités avec les problématiques des participants

Formateurs et formatrices

Eulalio TORRES, Docteur en Ingénierie Aérospatiale avec trajectoire internationale et expérience dans l’analyse des données en plusieurs secteurs.

Informations pratiques

• Email (contact pédagogique) : ingetorresg@gmail.com
• Dates prévisionnelles : 04, 05, 06, 07 avril 2022 de 9h à 16h
• Lieu :  à distance
• Durée : 4 jours/ 24h
• Pré-requis : Bases de statistiques sont recommandées mais pas obligatoires. Ordinateur et envie d’apprendre.
• Public visé : Doctorants
• Effectif maximum : 20

Code

OUN18

Public

Doctorants

Durée

4 jours/ 24h

Langue

Français

Format

Distanciel

Formations dans la même catégorie