• Composante

    École Nationale Supérieure d'Électrotechnique d'Électronique d'Informatique d'Hydraulique et des Télécommunications

Objectifs

À l'issue de ce cours, les étudiants seront capables de mettre en œuvre les principales méthodes d'analyse de données multivariées : réduction de dimension par ACP, classification supervisée (bayésienne) et non supervisée (k-means), et modélisation par régression linéaire. Ils sauront choisir et évaluer la méthode adaptée à un jeu de données réel, en implémentant l'ensemble de la chaîne d'analyse sous Python.

Lire plus

Description

Ce cours introduit les techniques statistiques fondamentales pour l'analyse de grands tableaux de données. Il couvre la chaîne complète d'analyse : prétraitements (corrélation, ACP), classification supervisée bayésienne et non supervisée par k-means, et régression linéaire par moindres carrés. Les concepts sont illustrés par des cas d'étude concrets (classification d'alcools par capteurs QCM, détection d'activités humaines via accéléromètre) et approfondis dans un projet fil rouge réalisé en binôme sous forme de notebook Python.

Le projet d'analyse de données réalisé par les étudiants s'articulent autour de données capteurs (Inertial Measurement Unit) pour la détection d'activités par exemple et la création d'un pipeline d'analyse complet.

Lire plus

Pré-requis obligatoires

Langage python

Base d'algèbre linéaire

Lire plus