
About This Course
Ce cours constitue le prolongement supervisé de l'Analyse des données 1 : on ne cherche plus seulement à décrire des structures cachées, mais à prédire une variable cible à partir de variables explicatives, et à évaluer rigoureusement la qualité de cette prédiction.
La régression logistique modélise la probabilité d'appartenance à une classe via la fonction sigmoïde P(Y=1|X) = σ(Xβ), offrant un cadre probabiliste interprétable pour la classification binaire ou multiclasse. Les méthodes de régularisation Ridge (L2) et Lasso (L1) permettent de contrôler la complexité du modèle, le Lasso induisant une sélection automatique de variables par mise à zéro de certains coefficients.
Les Support Vector Machines (SVM) cherchent la frontière de décision qui maximise la marge entre les classes ; le kernel trick étend cette approche aux espaces non linéaires. La qualité d'un modèle est évaluée au moyen de la matrice de confusion, de l'accuracy, de la précision, du rappel et de la courbe ROC (AUC), indicateurs qui distinguent les différents types d'erreurs de classification.
La validation croisée (k-fold cross-validation) estime la performance en généralisation en évitant le surapprentissage. Ces outils constituent la base de l'apprentissage statistique supervisé moderne.
Requirements
Analyse des données 1
Course Staff

DJIDJOU Kevin
Ingénieur Telecom

Staff Member #2
Biography of instructor/staff member #2
Frequently Asked Questions
Quel navigateur web devrais-je utiliser ?
La plateforme fonctionne mieux avec les versions actuelles de Chrome, Edge, Firefox ou Safari ?