sethlsx / rossmann_store_sales_1

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

预测Rossmann商店销售额

文件说明

库中比较完整的保存了整个项目过程,因此文件较多,但其中有11个关键文件,分别是:

  • proposal.md:开题报告md格式
  • proposal.pdf:开题报告pdf格式
  • report.md:最终报告md格式
  • report.pdf:最终报告pdf格式
  • submit-final.csv:最终模型测试集输出结果
  • process-1.ipynb:评审前最终模型的训练文件
  • process-6.ipynb:根据评审反馈意见重新调整的代码
  • Visual.ipynb:可视化的文件
  • robust-1.ipynb:验证健壮性的文件

比较重要但因为比较大无法上传的文件有:

  • rossmann.model:最终模型
  • dtest.buffer:存储测试集的DMatrix
  • dtrain.buffer:存储训练集的DMatrix
  • dval.buffer:存储验证集的DMatrix

这些文件放在了百度网盘中:https://pan.baidu.com/s/10_1CR9VEfuk-YXudnp_1aw

使用的库

  • numpy
  • sklearn
  • xgboost
  • matplotlib
  • pandas
  • time
  • IPython.display

使用的python版本

Python 3.6.5 | packaged by conda-forge | (default, Apr 6 2018, 13:44:09) [GCC 4.2.1 Compatible Apple LLVM 6.1.0 (clang-602.0.53)] on darwin

机器硬件及操作系统

MacBook Pro (13-inch, 2017, Two Thunderbolt 3 ports) 处理器 2.3GHz Intel Core i5 内存 16GB 2133MHz LPDDR3 显卡 Intel Iris Plus Graphics 640 1536 MB 系统 macOS High Sierra v10.13.4

训练时间

  • 5928s
  • 1.65h

About


Languages

Language:Jupyter Notebook 100.0%