Composante
École Nationale Supérieure d'Électrotechnique d'Électronique d'Informatique d'Hydraulique et des Télécommunications
Objectifs
À l'issue de ce cours, les étudiants seront capables de mettre en œuvre les principales méthodes d'analyse de données multivariées : réduction de dimension par ACP, classification supervisée (bayésienne) et non supervisée (k-means), et modélisation par régression linéaire. Ils sauront choisir et évaluer la méthode adaptée à un jeu de données réel, en implémentant l'ensemble de la chaîne d'analyse sous Python.
Description
Ce cours introduit les techniques statistiques fondamentales pour l'analyse de grands tableaux de données. Il couvre la chaîne complète d'analyse : prétraitements (corrélation, ACP), classification supervisée bayésienne et non supervisée par k-means, et régression linéaire par moindres carrés. Les concepts sont illustrés par des cas d'étude concrets (classification d'alcools par capteurs QCM, détection d'activités humaines via accéléromètre) et approfondis dans un projet fil rouge réalisé en binôme sous forme de notebook Python.
Le projet d'analyse de données réalisé par les étudiants s'articulent autour de données capteurs (Inertial Measurement Unit) pour la détection d'activités par exemple et la création d'un pipeline d'analyse complet.
Pré-requis obligatoires
Langage python
Base d'algèbre linéaire
