llxy0660 / Deep_in_mnist

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Deep_in_mnist

  • 基于mnist手写数字数据集, 试验各种神经网络算法和优化技术;
  • 这是关于mnist识别项目研究论文的一个汇总:rodrigob.github.io : Classifiction datasets results
  • 关于正确率,这里将70000个完整数据分为训练集(50000)、验证集(10000)和测试集(10000),使用训练集训练模型,并通过验证集选取最优模型,最后在测试集上测试最优模型,得到正确率。

文件说明

1. mnist.pkl.gz

  • 这是一个包装很好的mnist数据集,包含所有原始的mnist数据;
  • 里面的数据分为3部分,训练集、验证集和测试集,每个数据集都是(X, y)格式,Xy分别为特征数组和标签数组。
  • 我在本地电脑上将其转换成了单个csv文件,不过文件大小超过了上传限制,所以这里又上传了我的格式转换代码save_all_mnist_to_csv.py
  • 另外需要提醒一下,这个数据集里面的特征数组已经归一化了。

2. save_all_mnist_to_csv.py

  • 提取mnist.pkl.gz中的数据,得到一个完整数据的.csv文件,其中数据的大小为(70000, 785),共70000个样例,其中标签在第一列。

训练文件

  • 包含六个训练文件,均是 Jupyter notebook 文件,使用 Keras 框架。
  • 可在下面点击相应的文件名,跳转到nbviewer直接查看对应内容,若需要在本地运行,请下载相应文件:)
  • 从带一个隐藏层的多层感知机开始,到使用原版的LeNet-5架构,再通过优化LeNet-5(增加滤波器的数量,使用DropoutBatchNormal),最后再进行图像增强,准确率从0.9789提升到0.9954
  • img文件夹里面是六个文件的可视化训练过程图

About

License:MIT License


Languages

Language:Jupyter Notebook 99.8%Language:Python 0.2%