Introduction à la Science des Données et au Machine Learning pour la Recherche
Résumé de la formation
PRE REQUIS : Indispensable d’avoir des connaissances basiques de programmation avec Python, ou avoir suivi la formation de Python, Bases de statistique sont recommandées mais ils ne sont pas obligatoires. Ordinateur et envies d’apprendre.
La Data Science est devenue un élément essentiel dans le monde de la recherche, permettant de révéler des informations cruciales à partir de vastes ensembles de données. Au cours de cette session, nous avons pour objectif de vous armer de compétences essentielles qui vous permettront de travailler efficacement avec des données, de les analyser statistiquement et de les représenter de manière pertinente. Notre programme couvre un large éventail de sujets, de l’exploration des données à l’utilisation de bibliothèques Python spécialisées dans l’analyse statistique, telles que NumPy, Pandas, Scikit-Learn et Keras.
Vous apprendrez à maîtriser les concepts fondamentaux du Machine Learning, une discipline qui ouvre la voie à des opportunités illimitées pour la recherche. Nous vous guiderons à travers la conception et la mise en œuvre complète de projets de Machine Learning, vous permettant ainsi d’appliquer ces connaissances de manière pratique.
Que vous soyez chercheur, doctorant, ingénieur, technicien ou que vous représentiez une entreprise ou une collectivité, cette formation vous dotera des compétences nécessaires pour prendre des décisions éclairées en utilisant les données. Préparez-vous à découvrir la puissance de la Data Science et du Machine Learning dans le contexte de la recherche.
Programme
Jour 1 :
Bref rappel du langage Python dans Anaconda
Les consoles et le débogage en python
Le langage (la syntaxe, les structures (string, listes, dictionnaires…), les opérateurs et les fonctions)
Construction d’un outil de calcul de statistiques simples
Les classes, les objets et la création de bibliothèques
Python pour le traitement des données
Le processus de développement d’un outil en python pour la data science
Cas pratique.
Jour 2 :
L’importation des données (texte, csv, Excel)
La préparation et le nettoyage des données (jointure, filtre, transformation, traitement des données manquantes avec pandas, numpy et scipy)
La data visualisation
Graphiques simples avec matplotlib et seaborn : scatter plot, box plot, histogrammes.
Introduction à la machine Learning : présentation des principes de l’apprentissage automatique
Cas Pratique
Jour 3 :
Préparation des données avec la bibliothèque scikit-learn
Cas pratiques en machine Learning – Problème supervisée
L’extraction d’informations pertinentes
Algorithmes de Classification et régression
Clustering
Cas pratique
Jour 4:
Analyse de texte
NLP
Classification pour NLP
Discussions et démonstrations de fonctionnalités avancées sur les problématiques des participants
Formateurs et formatrices
Eulalio TORRES, Docteur en Ingénierie Aérospatiale avec trajectoire internationale et expérience dans l’analyse des données en plusieurs secteurs.
Informations pratiques
• Email (contact pédagogique) : ingetorresg@gmail.com
• Dates de la formation : 16, 17 et 24 avril 2024 de 9H à 12H et de 13H à 16 H – Formation en distanciel de 9h à 16h
• Lieu : à distance
• Durée : 3 jours/ 18h
• Pré-requis : Connaissances basiques de statistique recommandées.
Code
DF23OUML
Public
Doctorants
Durée
3 jours/ 18h
Langue
Français – Anglais
Format
Distanciel
Formations dans la même catégorie
Elaborer sa recherche à l’aide d’outils numériques – Initiation à R
Langue : Français
Format : Présentiel
Code : DF23ONER-2
Advanced Applied Data Analytics
Langue : Anglais
Format : Distanciel
Code : DFONAA
Zotero : Modifier un style
Langue : Français
Format : Distanciel
Code : OUN01
Zotero : prise en main complète
Langue : Français
Format : Distanciel / Présentiel
Code : OUN10
Zotero : niveau avancé
Langue : Français
Format : Distanciel
Code : OUN11
Pratique de l’ordinateur et d’Internet pour doctorants
Langue : Français
Format : Présentiel
Code : OUN14
Elaborer sa recherche à l’aide d’outils numériques – Initiation à LaTeX
Langue : Français
Format : Présentiel
Code : DF23ONER
Bioinformatique, l’outil informatique des biologistes
Langue : Français
Format : Présentiel
Code : DF23ONB