Apiao-1 / BankMarketing

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

项目结构简介

由于整个项目做完代码太多了就没有合并到一起(合到一起代码太长逻辑看起来没那么清晰),麻烦老师了,可以主要看前3个notebook,项目的对外的核心为前3个jupyter notebook文件,如下:

  1. 1.ExploratoryDataAnalysis(EDA).ipynb探索性数据分析,未修改原数据,通过大量的图表进行了数据分析,为第二步特征工程做铺垫
  2. 2.feature_engineering.ipynb:特征工程,包括数据预处理、构造特征、筛选特征,最后的结果写入process_data文件夹,作为第三步模型的输入,达到解耦
  3. 3.models.ipynb模型搭建、训练、预测评估结果可视化,包含13类模型以及集成学习的部分

剩下两个文件为辅助性的jupyter notebook文件,如下:

  1. 4.sampler_test.ipynb:解决数据不平衡时,用于测试欠采样、过采样与不处理在基模型base model上的表现
  2. 5.bayies_lgbm.ipynb:其中之一的调参文件,通过贝叶斯优化进行lightGbM模型的参数调优

此外的文件夹为整个项目的完整源代码,说明如下:

  1. data:用于储存原始数据(提交的版本为节省大小已删除)
  2. procee_data: 用于储存特征工程处理后的数据,即模型最终的输入(提交的版本为节省大小已删除)
  3. layers: 深度学习模型复用的自定义网络层
  4. models:所有基于tensorflow的自定义深度学习模型
  5. utils:整个程序会用到的复用的功能性代码,如数据采样,网络的输入处理,评价指标,网络结构测试
  6. workspace:所有分类模型的实现、训练及模型评价的最终目录,包含模型融合

About


Languages

Language:Jupyter Notebook 98.1%Language:Python 1.9%