Introduction à la Science des Données et au Machine Learning pour la Recherche

Résumé de la formation

PRE REQUIS : Indispensable d’avoir des connaissances basiques de programmation avec Python, ou avoir suivi la formation de Python, Bases de statistique sont recommandées mais ils ne sont pas obligatoires. Ordinateur et envies d’apprendre.

La Data Science est devenue un élément essentiel dans le monde de la recherche, permettant de révéler des informations cruciales à partir de vastes ensembles de données. Au cours de cette session, nous avons pour objectif de vous armer de compétences essentielles qui vous permettront de travailler efficacement avec des données, de les analyser statistiquement et de les représenter de manière pertinente. Notre programme couvre un large éventail de sujets, de l’exploration des données à l’utilisation de bibliothèques Python spécialisées dans l’analyse statistique, telles que NumPy, Pandas, Scikit-Learn et Keras.
Vous apprendrez à maîtriser les concepts fondamentaux du Machine Learning, une discipline qui ouvre la voie à des opportunités illimitées pour la recherche. Nous vous guiderons à travers la conception et la mise en œuvre complète de projets de Machine Learning, vous permettant ainsi d’appliquer ces connaissances de manière pratique.
Que vous soyez chercheur, doctorant, ingénieur, technicien ou que vous représentiez une entreprise ou une collectivité, cette formation vous dotera des compétences nécessaires pour prendre des décisions éclairées en utilisant les données. Préparez-vous à découvrir la puissance de la Data Science et du Machine Learning dans le contexte de la recherche.

Programme

Jour 1 :
Bref rappel du langage Python dans Anaconda
Les consoles et le débogage en python
Le langage (la syntaxe, les structures (string, listes, dictionnaires…), les opérateurs et les fonctions)
Construction d’un outil de calcul de statistiques simples
Les classes, les objets et la création de bibliothèques
Python pour le traitement des données
Le processus de développement d’un outil en python pour la data science
Cas pratique.

Jour 2 :
L’importation des données (texte, csv, Excel)
La préparation et le nettoyage des données (jointure, filtre, transformation, traitement des données manquantes avec pandas, numpy et scipy)
La data visualisation
Graphiques simples avec matplotlib et seaborn : scatter plot, box plot, histogrammes.
Introduction à la machine Learning : présentation des principes de l’apprentissage automatique
Cas Pratique

Jour 3 :

Préparation des données avec la bibliothèque scikit-learn
Cas pratiques en machine Learning – Problème supervisée
L’extraction d’informations pertinentes
Algorithmes de Classification et régression
Clustering
Cas pratique

Jour 4:
Analyse de texte
NLP
Classification pour NLP

Discussions et démonstrations de fonctionnalités avancées sur les problématiques des participants

Formateurs et formatrices

Eulalio TORRES, Docteur en Ingénierie Aérospatiale avec trajectoire internationale et expérience dans l’analyse des données en plusieurs secteurs.

Informations pratiques

• Email (contact pédagogique) : ingetorresg@gmail.com
Dates de la formation : 16, 17 et 24 avril 2024 de 9H à 12H et de 13H à 16 H – Formation en distanciel de 9h à 16h
Lieu :  à distance
Durée : 3 jours/ 18h
Pré-requis : Connaissances basiques de statistique recommandées.

Code

DF23OUML

Public

Doctorants

Durée

3 jours/ 18h

Langue

Français – Anglais

Format

Distanciel

Formations dans la même catégorie