Composante
École Nationale Supérieure d'Électrotechnique d'Électronique d'Informatique d'Hydraulique et des Télécommunications
Objectifs
- Avec l'explosion des problèmes de big data, l'apprentissage statistique est devenu un domaine très en vogue. Dans ce cours, de nombreuses méthodes statistiques linéaires et non linéaires sont abordées et pratiquées. L'enseignement est résolument axé sur la pratique avec des travaux pratiques R ou Python pour chaque méthode (20% théorie, 80% pratique).
- Les étudiants seront capables d'optimiser chaque modèle pour les comparer et finalement choisir la méthode la plus efficace sur les données disponibles.
Description
- Leçon + travaux pratiques pour chaque partie :
Introduction : apprentissage statistique, régression & classification - Modèles linéaires - GAM - Arbres de décision - Méthodes d'agrégation de modèles (Bagging, Random forests, Boosting) - Machines à vecteurs de support - Réseaux neuronaux & Deep Learning.
Pré-requis obligatoires
- R & Python, statistiques inférentielles, modèle linéaire gaussien, régression logistique