borisbaldassari / unhappy-earth

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

UnhapPyEarth

Ce référentiel est un projet d'application des méthodes de data analyst aux données du réchauffement climatique.

Description générale:

Nos humbles objectifs d'apprentissage sur ce projet sont les suivants :

  • Montrer, en s'appuyant sur des données publiquement disponibles, que le réchauffement climatique est observable.
  • Etudier son évolution passée, en fonction des années et des pays et régions du globe.
  • Proposer une corrélation entre les quantités de CO2 émises par l'Homme et la montée des températures.
  • Proposer une prévision des évolutions de température sur les 30 prochaines années, en fonction des données actuelles de température (et à l'exclusion de tout autre facteur climatique).

Organisation du référentiel

Le référentiel est organisé comme suit :

  • Les jeux de données sont disponibles dans le répertoire data/.
  • Les notebooks Jupyter sont disponibles dans le répertoire Colab Notebooks/.

Il est à noter que ce référentiel est un export simple d'un fichier Jupyter Notebook, hébergé sur Google Colab. Il n'est donc pas exécutable tel quel.

Déroulé

  1. Étape 1/ Audit des données + DataViz’ : Deadline Jeudi 16 Juin

La tâche est relativement simple, vous devrez fixer votre jeu de données et faire une analyse presque exhaustive de celles-ci. Au moins 5 visualisations jolies et surtout pertinentes. Il faudra aussi accompagner votre travail d'analyses statistiques de qualité. Pour chaque visualisation, j’attends :

  • Un commentaire précis, qui analyse la figure et apporte un avis “métier”.
  • Une validation du constat par des manipulations de données, ou un test statistique.
  1. Étape 2/ Modélisation / Analytics + Rapport : Deadline Jeudi 22 Septembre

3 steps :

  • Step 1 : Élaboration d’un modèle et premières itérations. Tentez toutes les options possibles de modèles que vous connaissez.
  • Step 2 : Élaboration de premières analyses.
  • Step 3 : Interprétations : Cherchez à comprendre vos premiers résultats, vos premières erreurs etc... Vous aurez normalement assisté à une MasterClass sur l’interprétabilité, servez-vous des outils présentés. Cette étape est à faire de manière intelligente, ne relevez pas des erreurs ou des résultats pour la beauté de les avoir relevés.
  • Step 4 : Conclusions scientifiques et métiers en fonction du succès ou de l’échec de la modélisation / de l'analyse. En cas d’échec, creusez sur les causes.

Au cours de cette importante étape, pour contrôler l’évolution du code j’attends deux itérations au moins, à rendre respectivement pour le Mercredi 13 Juillet (Itération 1) et le Jeudi 11 Aout (Itération 2). Comme précisé ci-dessus, vous devrez alors rendre votre rapport final ainsi que vos codes pour le Vendredi 22 Septembre!

  1. Étape 3/ Streamlit et soutenances: Jeudi 20 Octobre (Non défini)

Cette dernière étape servira à développer une application web interactive grâce à Streamlit qui servira de vitrine pour partager votre projet. La Masterclass 4 vous introduira à l’outil Streamlit et vous montrera ses divers outils. Il faudra que votre application soit esthétique, codée proprement et fonctionne sans bugs.

Deadlines:

  • Etape 2:

    • le Mercredi 13 Juillet (Itération 1)
    • le Jeudi 11 Aout (Itération 2)
    • le Jeudi 22 Septembre (Rapport)
  • Etape 3: Soutenance

    • le jeudi 20 octobre (soutenance)

About


Languages

Language:HTML 62.1%Language:Jupyter Notebook 37.0%Language:Python 0.8%Language:CSS 0.0%