基于SparkML2.0进行的Kaggle、JData等比赛
比赛1 2018JData如期而至销量预测 top35
比赛2 Kaggle-Standand银行客户隐含价值预测 11%
比赛3 Kaggle-GoogleAnalyse谷歌的用户价值分析,后由于工作量陡增,没时间继续做下去。
使用TransmogrifAI框架实现初步的特征工程与模型选择,该框架于9月份开源,还是有很多不完善的地方,但是却有了完全不同的数据科学思路,值的公司深入研究。
比赛4 Kaggle-PrimePaths 最短路径(图计算相关)
和数据科学没有太多关系,是一个典型的旅行商问题