kobelzy / SparkML

基于SparkML2.0进行的Kaggle、JData等比赛

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

SparkML

Spark version Scala version

基于SparkML2.0进行的Kaggle、JData等比赛

比赛1 2018JData如期而至销量预测 top35

比赛2 Kaggle-Standand银行客户隐含价值预测 11%

比赛3 Kaggle-GoogleAnalyse谷歌的用户价值分析,后由于工作量陡增,没时间继续做下去。

使用TransmogrifAI框架实现初步的特征工程与模型选择,该框架于9月份开源,还是有很多不完善的地方,但是却有了完全不同的数据科学思路,值的公司深入研究。

比赛4 Kaggle-PrimePaths 最短路径(图计算相关)

和数据科学没有太多关系,是一个典型的旅行商问题

About

基于SparkML2.0进行的Kaggle、JData等比赛


Languages

Language:Scala 67.6%Language:Python 22.8%Language:Java 6.0%Language:Jupyter Notebook 3.5%