Passer au contenu principal

Programmation Python

ISSEA
Enrollment is Closed

About This Course

Ce cours forme à l'utilisation de Python comme outil principal du data scientist, de la manipulation brute des données jusqu'à la mise en production d'un modèle prédictif. L'environnement Jupyter Notebook constitue le cadre de travail interactif central.

NumPy est la fondation numérique : tableaux multidimensionnels (ndarray), opérations vectorisées, algèbre linéaire et génération de données aléatoires. Sa rapidité repose sur le broadcasting et l'évitement des boucles Python. Pandas s'appuie sur NumPy pour offrir les structures DataFrame et Series, adaptées aux données tabulaires hétérogènes. Le cours couvre l'ingestion (CSV, JSON, SQL), le nettoyage (valeurs manquantes, doublons, types), le filtrage, le groupby et les jointures.

L'analyse exploratoire (EDA) mobilise Matplotlib et Seaborn pour produire distributions, scatter plots, heatmaps de corrélation et boxplots. La visualisation oriente les choix de feature engineering : encodage des variables catégorielles, normalisation, création de nouvelles features.

Scikit-learn unifie la modélisation en un pipeline cohérent : séparation train/test, cross-validation, régression, classification, et évaluation par accuracy, RMSE, AUC. Le cours insiste sur la reproductibilité du pipeline complet, du read_csv() au model.predict() et introduit les bonnes pratiques de structuration de projets data.

Requirements

Algorithmique

Course Staff

DJIDJOU Kevin 

Ingénieur Telecom

Course Staff Image #2

Staff Member #2

Biography of instructor/staff member #2

Frequently Asked Questions

Quel navigateur web devrais-je utiliser ?

La plateforme fonctionne mieux avec les versions actuelles de Chrome, Edge, Firefox ou Safari ?

Course Summary

  1. Course Number

    INFO1003
  2. Classes Start

  3. Classes End

  4. Estimated Effort

    20:00
  5. Prerequisites

    ISSEA INFO1002

    You must successfully complete ISSEA INFO1002 before you begin this course.