Programmation Python

About This Course

Ce cours forme à l'utilisation de Python comme outil principal du data scientist, de la manipulation brute des données jusqu'à la mise en production d'un modèle prédictif. L'environnement Jupyter Notebook constitue le cadre de travail interactif central.

NumPy est la fondation numérique : tableaux multidimensionnels (ndarray), opérations vectorisées, algèbre linéaire et génération de données aléatoires. Sa rapidité repose sur le broadcasting et l'évitement des boucles Python. Pandas s'appuie sur NumPy pour offrir les structures DataFrame et Series, adaptées aux données tabulaires hétérogènes. Le cours couvre l'ingestion (CSV, JSON, SQL), le nettoyage (valeurs manquantes, doublons, types), le filtrage, le groupby et les jointures.

L'analyse exploratoire (EDA) mobilise Matplotlib et Seaborn pour produire distributions, scatter plots, heatmaps de corrélation et boxplots. La visualisation oriente les choix de feature engineering : encodage des variables catégorielles, normalisation, création de nouvelles features.

Scikit-learn unifie la modélisation en un pipeline cohérent : séparation train/test, cross-validation, régression, classification, et évaluation par accuracy, RMSE, AUC. Le cours insiste sur la reproductibilité du pipeline complet, du read_csv() au model.predict() et introduit les bonnes pratiques de structuration de projets data.

La plateforme fonctionne mieux avec les versions actuelles de Chrome, Edge, Firefox ou Safari ?

Course Summary

Course Number

INFO1003

Classes Start

Classes End

Estimated Effort

20:00

Prerequisites

ISSEA INFO1002

You must successfully complete ISSEA INFO1002 before you begin this course.

Programmation Python

About This Course

Requirements

Course Staff

DJIDJOU Kevin

Staff Member #2

Frequently Asked Questions

Quel navigateur web devrais-je utiliser ?

Course Summary