在0.07baseline的基础上改进的 减少了cache文件的空间占用
- pandas
- sklearn
- xgboost
- data: 储存数据目录
- cache: 缓存目录
- sub: 结果目录
- train: 训练代码
- gen_feat: 生成特征
python train.py
第一次运行时会产生大量的中间文件,大约需要4G硬盘空间,同时也会占用大量的内存,大约20G,如果出现了MemoryError,可以尝试结束进程并重新运行,读取中间文件可以节约时间。
JData京东算法大赛入门程序
在0.07baseline的基础上改进的 减少了cache文件的空间占用
python train.py
第一次运行时会产生大量的中间文件,大约需要4G硬盘空间,同时也会占用大量的内存,大约20G,如果出现了MemoryError,可以尝试结束进程并重新运行,读取中间文件可以节约时间。
JData京东算法大赛入门程序