Passer au contenu principal

Analyse des données 2

ISSEA
Enrollment is Closed

About This Course

Ce cours constitue le prolongement supervisé de l'Analyse des données 1 : on ne cherche plus seulement à décrire des structures cachées, mais à prédire une variable cible à partir de variables explicatives, et à évaluer rigoureusement la qualité de cette prédiction.

La régression logistique modélise la probabilité d'appartenance à une classe via la fonction sigmoïde P(Y=1|X) = σ(Xβ), offrant un cadre probabiliste interprétable pour la classification binaire ou multiclasse. Les méthodes de régularisation  Ridge (L2) et Lasso (L1) permettent de contrôler la complexité du modèle, le Lasso induisant une sélection automatique de variables par mise à zéro de certains coefficients.

Les Support Vector Machines (SVM) cherchent la frontière de décision qui maximise la marge entre les classes ; le kernel trick étend cette approche aux espaces non linéaires. La qualité d'un modèle est évaluée au moyen de la matrice de confusion, de l'accuracy, de la précision, du rappel et de la courbe ROC (AUC), indicateurs qui distinguent les différents types d'erreurs de classification.

La validation croisée (k-fold cross-validation) estime la performance en généralisation en évitant le surapprentissage. Ces outils constituent la base de l'apprentissage statistique supervisé moderne.

Requirements

Analyse des données 1

Course Staff

DJIDJOU Kevin 

Ingénieur Telecom

Course Staff Image #2

Staff Member #2

Biography of instructor/staff member #2

Frequently Asked Questions

Quel navigateur web devrais-je utiliser ?

La plateforme fonctionne mieux avec les versions actuelles de Chrome, Edge, Firefox ou Safari ?

Course Summary

  1. Course Number

    STAT4004
  2. Classes Start

  3. Classes End

  4. Estimated Effort

    20:00
  5. Prerequisites

    ISSEA STAT1002

    You must successfully complete ISSEA STAT1002 before you begin this course.