
About This Course
Ce cours forme à l'utilisation de Python comme outil principal du data scientist, de la manipulation brute des données jusqu'à la mise en production d'un modèle prédictif. L'environnement Jupyter Notebook constitue le cadre de travail interactif central.
NumPy est la fondation numérique : tableaux multidimensionnels (ndarray), opérations vectorisées, algèbre linéaire et génération de données aléatoires. Sa rapidité repose sur le broadcasting et l'évitement des boucles Python. Pandas s'appuie sur NumPy pour offrir les structures DataFrame et Series, adaptées aux données tabulaires hétérogènes. Le cours couvre l'ingestion (CSV, JSON, SQL), le nettoyage (valeurs manquantes, doublons, types), le filtrage, le groupby et les jointures.
L'analyse exploratoire (EDA) mobilise Matplotlib et Seaborn pour produire distributions, scatter plots, heatmaps de corrélation et boxplots. La visualisation oriente les choix de feature engineering : encodage des variables catégorielles, normalisation, création de nouvelles features.
Scikit-learn unifie la modélisation en un pipeline cohérent : séparation train/test, cross-validation, régression, classification, et évaluation par accuracy, RMSE, AUC. Le cours insiste sur la reproductibilité du pipeline complet, du read_csv() au model.predict() et introduit les bonnes pratiques de structuration de projets data.
Requirements
Algorithmique
Course Staff

DJIDJOU Kevin
Ingénieur Telecom

Staff Member #2
Biography of instructor/staff member #2
Frequently Asked Questions
Quel navigateur web devrais-je utiliser ?
La plateforme fonctionne mieux avec les versions actuelles de Chrome, Edge, Firefox ou Safari ?