OpenClassRooms projet 3: Anticipez les besoins en consommation de bâtiments
Des relevés minutieux ont été effectués par les agents de la ville en 2016. Voici les données et leur source.
- Réaliser une courte analyse exploratoire (One hot encoder, transformation et normalisation des variables, imputation des valeures manquante spar KNN).
- Tester différents modèles de prédiction afin de répondre au mieux à la problématique :
-
Création d'une fonction qui permet de réaliser un K-fold avec grid search pour une optimisation des meilleurs hyperparamètres en choisissant une ou plusieurs métriques de "goodness of fit".
-
Cette fonction permet de tester divers algorithmes de régression tels que Random Forest, XGBoost, Ridge, Lasso, Elastic Net et Kernel Ridge.
-
Fonction pour visualiser des facteurs et leur importance, que ce soit pour les algorithmes de Random Forest, XGBoost, Ridge, Lasso, Elastic Net et Kernel Ridge..
-
Fonction principale pour réaliser l'ensemble du pipeline de production :
-
- Mettre en place le modèle d'apprentissage supervisé adapté au problème métier
- Adapter les hyperparamètres d'un algorithme d'apprentissage supervisé afin de l'améliorer
- Transformer les variables pertinentes d'un modèle d'apprentissage supervisé
- Évaluer les performances d’un modèle d'apprentissage supervisé
- Un notebook de l'analyse exploratoire mis au propre et annoté.
- Un notebook pour chaque prédiction (émissions de CO2 et consommation totale d’énergie) des différents tests de modèles mis au propre, dans lequel vous identifierez clairement le modèle final choisi.
- Un support de présentation pour la soutenance.