mikaleroy / Anticipez-les-besoins-en-consommation-electrique-de-batiments

Projet OC

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Anticipez les besoins en consommation électrique de bâtiments

Vous travaillez pour la ville de Seattle. Pour atteindre son objectif de ville neutre en émissions de carbone en 2050, votre équipe s’intéresse de près aux émissions des bâtiments non destinés à l’habitation.

Les données

Les données de consommation sont à télécharger à cette adresse.

Problématique de la ville de Seattle

Des relevés minutieux ont été effectués par vos agents en 2015 et en 2016. Cependant, ces relevés sont coûteux à obtenir, et à partir de ceux déjà réalisés, vous voulez tenter de prédire les émissions de CO2 et la consommation totale d’énergie de bâtiments pour lesquels elles n’ont pas encore été mesurées.

Votre prédiction se basera sur les données déclaratives du permis d'exploitation commerciale (taille et usage des bâtiments, mention de travaux récents, date de construction..)

Vous cherchez également à évaluer l’intérêt de l’ENERGY STAR Score pour la prédiction d’émissions, qui est fastidieux à calculer avec l’approche utilisée actuellement par votre équipe.

#Votre mission Vous sortez tout juste d’une réunion de brief avec votre équipe. Voici un récapitulatif de votre mission :

  1. Réaliser une courte analyse exploratoire.
  2. Tester différents modèles de prédiction afin de répondre au mieux à la problématique.

Avant de quitter la salle de brief, Douglas, le project lead, vous donne quelques pistes, et erreurs à éviter :

  • L’objectif est de te passer des relevés de consommation annuels (attention à la fuite de données), mais rien ne t'interdit d’en déduire des variables plus simples (nature et proportions des sources d’énergie utilisées).

  • Fais bien attention au traitement des différentes variables, à la fois pour trouver de nouvelles informations (peut-on déduire des choses intéressantes d’une simple adresse ?) et optimiser les performances en appliquant des transformations simples aux variables (normalisation, passage au log, etc.).

  • Mets en place une évaluation rigoureuse des performances de la régression, et optimise les hyperparamètres et le choix d’algorithme de ML à l’aide d’une validation croisée.

#Compétences évaluées

  • Mettre en place le modèle d'apprentissage supervisé adapté au problème métier
  • Évaluer les performances d’un modèle d'apprentissage supervisé
  • Adapter les hyperparamètres d'un algorithme d'apprentissage supervisé afin de l'améliorer
  • Transformer les variables pertinentes d'un modèle d'apprentissage supervisé

About

Projet OC


Languages

Language:Jupyter Notebook 50.8%Language:HTML 49.2%