Lseeon 2 TASK: A Classification network on Cifar10

.
├── imgs
│   ├── Acc.svg
│   ├── confuse_matrix.png
│   ├── CrossEntropy.png
│   └── lineplot.png
├── net
│   ├── CifarNet.py
│   └── ResNet.py
├── plotConfuseMatrix.py
├── readMe.md
├── requirements.txt
├── test.py
├── tools
│   ├── dataset.py
│   ├── ext_transforms.py
│   ├── losses.py
│   ├── metric.py
│   ├── scheduler.py
│   ├── utils_bn.py
│   └── utils.py
├── train_data
│   ├── plotImg.py
│   ├── run-0-tag-Acc.csv
│   ├── run-1-tag-Acc.csv
│   ├── run-2-tag-Acc.csv
│   ├── run-3-tag-Acc.csv
│   └── run-4-tag-Acc.csv

网络结构

本次作业的整体网络由主干特征提取网络 + 特征分类网络组成
主干提取网络采用ResNet50, 并修改最后的池化层, 将池化从全局池化操作, 改为卷积核为4像素大小的池化操作, 保留了更多的图像特征, 更加有益于分类器进行类别分类
特征分类网络采用线性层, 完成特征分类映射

训练细节

训练框架: pytorch
优化器: SGD
学习率: 0.01
权重衰减: 5e-4
BatchSize: 128
训练轮数: 250 epoch
损失函数: 交叉熵损失
学习率更新方式: WarmUp + Poly
数据增强方式: RandomCrop、RandomHorizontalFlip、RandomRotation
数据记录: 实验数据采用tensorboard记录并绘制相关曲线图

开始训练

pip install -r requirement.txt

python test.py

tensorboard --logdir runs

实验过程

1. 检察初始loss是否合理

对于初始网络来说, 交叉熵损失应为 -log(0.1) = 2.3026,  实验训练结果发现, 本网络在初始时网络loss在2.3左右, 对于10分类问题来说, 符合交叉熵的理论初始损失值.

2. 训练参数网格搜索

1. 训练参数采用网络搜索方式, 针对学习率, 优化器, 权重衰减系数进行网格化搜索, 从中选取效果较好的参数组合

2. 网格搜索时, 对每一种组合参数都训练 10 epoch, 并记录 10 轮中最好 Acc 成绩, 用于比较不同参数组合之间的优劣

3. 学习率参数的可选值为: 0.1, 0.01, 0.001

4. 优化器的可选值为: SGD、Adam

5. 权重衰减的可选值为: 1e-3, 5e-4, 1e-4

3. 各个参数组合实验结果

Base_lr	Optimizer	Weight Decay	Acc
0.1	SGD	1e-4	66.32%
0.1	SGD	5e-4	69.40%
0.1	SGD	1e-3	59.61%
0.1	Adam	1e-4	32.70%
0.1	Adam	5e-4	33.29%
0.1	Adam	1e-3	23.58%

0.01	SGD	1e-4	68.40%
0.01	SGD	5e-4	69.63%
0.01	SGD	1e-3	69.08%
0.01	Adam	1e-4	49.47%
0.01	Adam	5e-4	50.37%
0.01	Adam	1e-3	37.58%

0.001	SGD	1e-4	59.66%
0.001	SGD	5e-4	59.84%
0.001	SGD	1e-3	58.26%
0.001	Adam	1e-4	66.62%
0.001	Adam	5e-4	67.11%
0.001	Adam	1e-3	66.32%

4. 网络超参数选取

根据步骤3中的实验结果, 选取 base_lr: 0.01, 优化器: SGD, weight decay: 5e-4, 作为网络的最终超参数

网络最终实验结果

在设定了网络超参数之后, 进行了5次重复实验, 计算5次重复实验最优Acc指标的平均值与方差

Time	Acc
1	93.60%
2	93.49%
3	93.59%
4	93.57%
5	93.37%

Mean	Var
93.52%	0.096

5次重复实验过程绘制结果, 记录如下图所示, 记录CSV文件存放于 train_data/

第一次重复实验的混淆矩阵, 如下图所示

模型的分类错误结果展示，如下图所示

模型预测的tsne可视化结果图

网络预训练权重

Acc	百度网盘
93.60%	百度云链接密码: 5o80

Citing

If you find the code or the models useful, please cite this paper:

@article{DBLP:journals/corr/HeZRS15,
  author    = {Kaiming He and
               Xiangyu Zhang and
               Shaoqing Ren and
               Jian Sun},
  title     = {Deep Residual Learning for Image Recognition},
  volume    = {abs/1512.03385},
  year      = {2015},
}

License

The code and models are released under the MIT License (refer to the LICENSE file for details).

zhijiejia / AISafety-homework