Ce référentiel est un projet d'application des méthodes de data analyst aux données du réchauffement climatique.
Nos humbles objectifs d'apprentissage sur ce projet sont les suivants :
- Montrer, en s'appuyant sur des données publiquement disponibles, que le réchauffement climatique est observable.
- Etudier son évolution passée, en fonction des années et des pays et régions du globe.
- Proposer une corrélation entre les quantités de CO2 émises par l'Homme et la montée des températures.
- Proposer une prévision des évolutions de température sur les 30 prochaines années, en fonction des données actuelles de température (et à l'exclusion de tout autre facteur climatique).
Le référentiel est organisé comme suit :
- Les jeux de données sont disponibles dans le répertoire
data/
. - Les notebooks Jupyter sont disponibles dans le répertoire
Colab Notebooks/
.
Il est à noter que ce référentiel est un export simple d'un fichier Jupyter Notebook, hébergé sur Google Colab. Il n'est donc pas exécutable tel quel.
- Étape 1/ Audit des données + DataViz’ : Deadline
Jeudi 16 Juin
La tâche est relativement simple, vous devrez fixer votre jeu de données et faire une analyse presque exhaustive de celles-ci. Au moins 5 visualisations jolies et surtout pertinentes. Il faudra aussi accompagner votre travail d'analyses statistiques de qualité. Pour chaque visualisation, j’attends :
- Un commentaire précis, qui analyse la figure et apporte un avis “métier”.
- Une validation du constat par des manipulations de données, ou un test statistique.
- Étape 2/ Modélisation / Analytics + Rapport :
Deadline Jeudi 22 Septembre
3 steps :
- Step 1 : Élaboration d’un modèle et premières itérations. Tentez toutes les options possibles de modèles que vous connaissez.
- Step 2 : Élaboration de premières analyses.
- Step 3 : Interprétations : Cherchez à comprendre vos premiers résultats, vos premières erreurs etc... Vous aurez normalement assisté à une MasterClass sur l’interprétabilité, servez-vous des outils présentés. Cette étape est à faire de manière intelligente, ne relevez pas des erreurs ou des résultats pour la beauté de les avoir relevés.
- Step 4 : Conclusions scientifiques et métiers en fonction du succès ou de l’échec de la modélisation / de l'analyse. En cas d’échec, creusez sur les causes.
Au cours de cette importante étape, pour contrôler l’évolution du code j’attends deux itérations au moins, à rendre respectivement pour le Mercredi 13 Juillet (Itération 1) et le Jeudi 11 Aout (Itération 2)
.
Comme précisé ci-dessus, vous devrez alors rendre votre rapport final ainsi que vos codes pour le Vendredi 22 Septembre!
- Étape 3/ Streamlit et soutenances:
Jeudi 20 Octobre (Non défini)
Cette dernière étape servira à développer une application web interactive grâce à Streamlit qui servira de vitrine pour partager votre projet. La Masterclass 4 vous introduira à l’outil Streamlit et vous montrera ses divers outils. Il faudra que votre application soit esthétique, codée proprement et fonctionne sans bugs.
-
Etape 2:
le Mercredi 13 Juillet (Itération 1)
le Jeudi 11 Aout (Itération 2)
le Jeudi 22 Septembre (Rapport)
-
Etape 3: Soutenance
le jeudi 20 octobre (soutenance)