PythonDataMining
在学院的书架上发现了一本不带脑子就能看懂的书《Python数据挖掘与实战》
-
- 体积略大(8.8Mb),谨慎点击,建议
clone
或fork
- 体积略大(8.8Mb),谨慎点击,建议
-
随书附带的代码在
./BOOK_CODE
文件夹下面,全英文- 原书有些数据集不包含在内,因为这些数据需要从其他网站上下载,而网站已经更新,书编写时的数据很难再找到
- 有些数据还要翻墙才拿得到,比如第六章”使用朴素贝叶斯进行社交媒体挖掘”时,数据集需要通过
twitter
的API
来获取,要在代码里翻墙 - 我根据书中的需要,一个一个重新把数据集找到,放到
./data
目录下 - 懒得一个一个改随书附带的代码里面的路径,遂在随书附带的代码的基础上做了中文版
-
阅读笔记在当前目录
./
下 -
知识点在笔记notes
-
最后,厚着脸皮要 star ,嘤嘤嘤~~
笔记目录
- 数据挖掘流程简单示例10min.ipynb
- 用近邻算法分类.ipynb
- 用决策树预测获胜球队.ipynb
- 用亲和性分析推荐电影.ipynb
- 用转换器抽取特征.ipynb
- 用朴素贝叶斯进行社会媒体挖掘.ipynb
- 用图挖掘找到感兴趣的人.ipynb
- 用神经网络破解验证码.ipynb
- 作者归属问题.ipynb
- 新闻语料分类.ipynb
- 用深度学习进行图象分类.ipynb
- 大数据处理.ipynb