Wvvi / subsidy-prediction-final

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

subsidy-prediction-final

高校大学生助学金预测文档

运行环境

  • python2,ipython notebook
  • 第三方库:numpy,pandas,matplotlib,scikit-learn0.18

数据来源

特征提取

  • 对每个表和每一列都进行对应的特征提取,代码详见feature-extraction-construction文件

特征连接

  • 将处理好后的特征文件,以学生学号为主键连接成一张表,特征总数为500多个特征,相关代码存放在merge-feature文件

特征预处理

  • 识别特征的异常值并进行相关处理,相关代码存放在preprocessing文件

模型调参与拟合

  • 以学生获奖数据作为标签,其它数据作为特征,用梯度提升决策树进行建模,相关代码存放在model文件。如果想运行model_fit_glb.ipynb脚步,需要额外安装Graphlab机器学习框架
  • 模型准确率:0.85

About


Languages

Language:Jupyter Notebook 100.0%