yzkang / My-Data-Competition-Experience

本人多次机器学习与大数据竞赛Top5的经验总结,满满的干货,拿好不谢

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

数据科学竞赛经验谈

如何做数据分析?
如何做数据清洗?
如何做特征工程?(面向关系型数据的特征工程系统化分析方法)
如何做特征选择?
如何选择合适的机器学习模型?
如何调参?
如何做模型融合?
如何上分刷榜?

目前文字版已开源,请大家前往知乎阅读:https://zhuanlan.zhihu.com/p/149769029

纯文字PDF版已经制作完成,已与PPT版一起上传至我的知识星球。想咨询竞赛经验、快速上分、争夺奖金的同学,欢迎到大卫的小屋与我交流:https://t.zsxq.com/IMfe2vB

联系方式

E-mail: davidkangyz@163.com

知识星球:https://t.zsxq.com/IMfe2vB

附录

本人竞赛成绩总结

年份 竞赛平台 举办单位 竞赛名称 竞赛成绩 排名
2017 科赛网 **平安 前海征信“好信杯”迁移学习算法大赛 第6名 6/600
2017 天池大数据众智平台 阿里云 第二届云安全算法挑战赛 第16名 16/959
2018 **农业银行 **农业银行软件开发中心 第一届“雅典娜杯”分析挖掘大赛 第2名 2/581
2018 马上金融AI竞赛平台 马上金融 AI全球挑战者大赛 — 违约风险识别赛 第4名 4/107
2018 天池大数据众智平台 阿里云 千里马大数据竞赛——风险识别算法赛 第5名 5/245
2018 蚂蚁金服金融科技平台 蚂蚁金服 蚂蚁开发者大赛 — 支付风险识别赛题 第9名 9/2986
2018 天池大数据众智平台 阿里巴巴 IJCAI2018 — 阿里妈妈国际广告算法大赛 前2%
2018 DataFountain **平安 产险数据建模大赛——驾驶行为预测驾驶风险 前2%
2018 kaggle Two Sigma Two Sigma Investment Financial Modeling Challenge 前3%
2019 天池大数据众智平台 天津市津南区政府 津南数字制造算法挑战赛 第2名 2/2682
2019 **农业银行 **农业银行软件开发中心 第二届“雅典娜杯”分析挖掘大赛 第4名 4/361

因时间冲突未获奖的竞赛

年份 竞赛平台 举办单位 竞赛名称 竞赛成绩
2016 滴滴AI竞赛平台 滴滴出行 首届全球DI-Tech算法大赛
2016 融360自建平台 融360 “天机”金融风控大数据竞赛
2017 DataCastle 融360 智慧**杯——用户贷款风险预测 前10%
2017 Kaggle Sberbank Sberbank Russian Housing Market
2017 天池大数据众智平台 高德 KDD CUP Highway Tollgates Traffic Flow Prediction
2018 京东智汇平台 京东 JData全球运筹优化大赛