2017KDDvolumePrediction 1、参加2017天池平台上KDD流量预测,才参与数据挖掘相对竞赛,能力有限,排名靠后; 2、初做比赛,代码里面搞了好多for循环,效率较低,优化空间很大; 3、genFeature.py用于数据预处理和特征工程构建; 4、predicted_by_xgb_linear.py用于模型预测,由于赛题属于线性回归问题,故使用xgb进行回归预测。