TOTOKA123456 / Kaggle_Learning

关于kaggle的一些记录,数据清洗的一些技巧,库函数的使用,比赛的流程

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

数据挖掘

ML建模与问题解决流程

  • 了解场景与目标
  • 了解评估准则
  • 认识数据(平衡?……)
  • 数据预处理(清洗、调权……)
  • 特征工程
  • 模型调参
  • 模型状态分析(过拟合、欠拟合)
  • 模型融合

主要工具

  • scikit-learn
  • numpy
  • pandas
  • TensorFlow(见TensorFlow-Cookbook)
  • matplotlib

学习资料

  • 以上各种库的文档
  • 《统计学习方法》
  • **大学-李宏毅 Machine Learning、Deep Learning课程
  • 深度学习-花书
  • TensorFlow Cookbook
  • 还有各种实践类型的外文书籍(manning出版社)

以上代码有点不完整

  • LendingClubQ3数据分析,主要学习:数据处理的技巧、简单的算法调用
  • LendingClub数据(包含原始数据 + 处理过的数据)从百度云取:链接:https://pan.baidu.com/s/1gMBGzSk51qAvlZFZVKVPmA 提取码:fjbj

About

关于kaggle的一些记录,数据清洗的一些技巧,库函数的使用,比赛的流程


Languages

Language:Jupyter Notebook 100.0%