yunshuipiao / sw-kaggle

code for kaggle https://www.kaggle.com/swensun

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

sw-kaggle

GitHub forks GitHub forks GitHub forks

关于 kaggle 问题的解答与优化

  • Titanic: Machine Learning from Disaster
    • 主要工作:可视化分析不同特征与存活率的关系, 类别特征one-hot编码,数值特征分段处理,pipeline预处理数据, 使用LR, RF等进行投票分类,最终排名top10%
      [github][nbviewer]
  • Digit Recognizer
    • 主要工作:多分类问题,给定手写数字,进行0-9识别。分别使用numpy,tensorflow搭建ANN, CNN进行训练,识别率98%
      [nbviewer]
  • Quora Question Pairs
    • 主要工作:使用nltk, sklearn,构建关于问题特征的向量进行相似性判断,采用lightgbm进行训练,完成相似问题判断。
      [nbviewer]

个人工作:

  • 机器学习之红楼梦作者判断

    • 主要工作:针对全书每一章节进行分词,tf-idf文档向量化,分别使用监督和无监督进行训练预测, 并与其它名著对比结果。
      [nbviewer]
  • [拉勾和Boss直聘关于机器学习岗位的简单分析]

    • 主要工作:在两个不同的求职平台,分别以 机器学习 为关键字, 进行搜索,获取全部结果,对其进行简单分析,代码和分析见以下链接。
      [nbviewer]

About

code for kaggle https://www.kaggle.com/swensun

License:Apache License 2.0


Languages

Language:Jupyter Notebook 99.6%Language:Python 0.4%