Analyse des données 2

About This Course

Ce cours constitue le prolongement supervisé de l'Analyse des données 1 : on ne cherche plus seulement à décrire des structures cachées, mais à prédire une variable cible à partir de variables explicatives, et à évaluer rigoureusement la qualité de cette prédiction.

La régression logistique modélise la probabilité d'appartenance à une classe via la fonction sigmoïde P(Y=1|X) = σ(Xβ), offrant un cadre probabiliste interprétable pour la classification binaire ou multiclasse. Les méthodes de régularisation Ridge (L2) et Lasso (L1) permettent de contrôler la complexité du modèle, le Lasso induisant une sélection automatique de variables par mise à zéro de certains coefficients.

Les Support Vector Machines (SVM) cherchent la frontière de décision qui maximise la marge entre les classes ; le kernel trick étend cette approche aux espaces non linéaires. La qualité d'un modèle est évaluée au moyen de la matrice de confusion, de l'accuracy, de la précision, du rappel et de la courbe ROC (AUC), indicateurs qui distinguent les différents types d'erreurs de classification.

La validation croisée (k-fold cross-validation) estime la performance en généralisation en évitant le surapprentissage. Ces outils constituent la base de l'apprentissage statistique supervisé moderne.

La plateforme fonctionne mieux avec les versions actuelles de Chrome, Edge, Firefox ou Safari ?

Course Summary

Course Number

STAT4004

Classes Start

Classes End

Estimated Effort

20:00

Prerequisites

ISSEA STAT1002

You must successfully complete ISSEA STAT1002 before you begin this course.

Analyse des données 2

About This Course

Requirements

Course Staff

DJIDJOU Kevin

Staff Member #2

Frequently Asked Questions

Quel navigateur web devrais-je utiliser ?

Course Summary