chagaz / sdd_2024

Cours de science des données en 1A à Mines Paris - PSL (2024)

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

UE 21.2 EC Science des données

Cours « science des données » à Mines Paris (2024). License: CC BY-SA 4.0

Organisation de ce repo

  • environment.yml permet de charger l'environnement conda pour les notebooks via l'interface graphique d'Anaconda ou
   conda env create -f environment.yml -n sdd2024
   conda activate sdd2024

Notez que cet environnement vous fait utiliser JupyterLab et non pas Jupyter Notebook. JupyterLab est plus moderne et plus agréable d'utilisation (voir la documentation). En particulier, JupyterLab permet de copier des cellules entre notebooks, et l'extension "Table of contents" qui facilite la navigation dans un notebook y est native.

  • poly/ contient tous les fichiers permettant de compiler le poly. La dernière version compilée à jour s'intitule sdd_2024_poly.pdf
  • pc/ contient un répertoire par PC
  • projet/ contient les données et instructions relatives au projet numérique.

Équipe pédagogique

  • Responsables de cours : Chloé-Agathe Azencott et Bruno Figliuzzi
  • Chargé·e·s d'enseignement : Julie Cartier, Théo Dumont, Paul Etheimer, Thibault Faney, Daniel Mimouni, Mathieu Molina et Corbinian Schlosser.

Emploi du temps

  • vendredi 7/06 :

    • 09h00-10h30 : amphi 1 — Introduction et statistique descriptive (Chapitres 1 & 2)
    • 10h45-12h15 : amphi 2 — Estimation et propriétés d'un estimateur (Chapitre 3, sections 3.1 à 3.4)
  • lundi 10/06 :

    • 09h00-10h30 : amphi 3 — Techniques d'estimation (Chapitre 3, sections 3.5 & 3.6)
    • 10h45-12h15 : amphi 4 — PC 1 — Statistique inférentielle (TD)
  • vendredi 14/06 :

    • 09h00-10h30 : amphi 4 — Réduction de dimension (Chapitre 4)
    • 10h45-12h15 : PC 2 — Réduction de dimension (TP)
  • lundi 17/06 :

    • 09h00-10h30 : amphi 5 — Introduction à l'apprentissage supervisé (Chapitre 6)
    • 10h45-12h15 : Mini-projet numérique (1)
  • vendredi 21/06 :

    • 09h00-10h30 : PC 3 — Pré-traitement & introduction à scikit-learn pour l'apprentissage supervisé
    • 10h45-12h15 : amphi 6 — Généralisation (Chapitre 7)
  • lundi 24/06 :

    • 09h00-10h30 : PC 4 — Sélection de modèles (TP)
    • 10h45-12h15 : amphi 7 — Modèles linéaires pour la classification (Chapitre 7)
  • vendredi 28/06 :

    • 09h00-10h30 : PC 5 — Modèles linéaires pour la classification (TD)
    • 10h45-12h15 : amphi 8 — Modèles d'apprentissage supervisé non-linéaires (Chapitre 8)
  • lundi 1/07 :

    • 09h00-10h30 : amphi 9 — Séance d'ouverture
    • 10h45-12h15 : Mini-projet numérique (2)
  • vendredi 5/07 9h-12h : examen écrit et rendu de projet numérique.

Modalités d'évaluation

  • mini-projet numérique à réaliser en binôme. Deux séances de PC y sont dévouées (le 17/06 et le 1/07). À rendre le 5/07 (30%).
  • examen sur table avec documents autorisés le 5/07 (70%).

Pour contribuer à ce repo Ce repo contient un script pre-commit.sh qui permet de le nettoyer (supprimer les fichiers auxiliaires de latex, nettoyer les notebooks avec nbstripout).

Il est possible de lancer automatiquement ce script lors d'un git commit grâce à un hook. Pour cela, il suffit de le copier dans le fichier .git/hooks/pre-commit ou d'utiliser un lien symbolique (pour conserver le contrôle de version) :

    cd .git/hooks/
    ln -s ../../pre-commit.sh pre-commit

About

Cours de science des données en 1A à Mines Paris - PSL (2024)


Languages

Language:Jupyter Notebook 51.2%Language:TeX 48.7%Language:Shell 0.1%