zhouyu1996 / MachineLearning_ex

统计学习方法实践

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

机器学习实践

备注:这是自己在归纳和学习传统机器学习方法中的实践代码。

1. 构造二分类任务的数据

传统机器学习的原始形式都是面向二分类任务,因此我们使用minist数据集构造了一个奇偶数识别的二分类任务。尽管该任务直接使用模型输出的效果不一定最好,毕竟mnist用CNN网络识别的正确率超过99%,显然可以识别数字后再判断奇偶性。不过,假定我们的任务具有一定的合理,毕竟我们面向的是学习模型本身,不对任务和数据做过多讨论。

  1. 下载原始mnist数据集

  2. 通过执行如下命令,生成我们的二分类数据集。数据集用csv保存。

    python transMinist2TwoCategories.py
    
    正例数量 负例数量 合计
    训练集 30508 29492 60000
    测试集 5074 4926 10000

2. LR模型原理及实现

LR模型知识点总结:详见我的博文

LR模型的实现:LR4classification.py。

About

统计学习方法实践


Languages

Language:Python 100.0%