jiaqiangbandongg / jd

JData京东算法大赛入门程序

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

JDATA算法大赛入门(LB 0.08553(F11:0.10404/F12:0.07320)+时间滑动窗口特征+xgboost模型)

在0.07baseline的基础上改进的 减少了cache文件的空间占用

依赖库

  • pandas
  • sklearn
  • xgboost

项目结构

  • data: 储存数据目录
  • cache: 缓存目录
  • sub: 结果目录
  • train: 训练代码
  • gen_feat: 生成特征

使用说明

python train.py

使用注意

第一次运行时会产生大量的中间文件,大约需要4G硬盘空间,同时也会占用大量的内存,大约20G,如果出现了MemoryError,可以尝试结束进程并重新运行,读取中间文件可以节约时间。

About

JData京东算法大赛入门程序


Languages

Language:Python 100.0%