CarryHJR/mouth_Instance_Segement

团队介绍：

队伍名称：mask
队伍成员：张卫良（江南大学研二）研究方向：2D目标检测

B榜结果： 0.68726892619，排名第二

环境信息

sys.platform: linux(Ubuntu 7.5.0-3ubuntu1~18.04)
Python: 3.7.4 (default, Aug 13 2019, 20:35:49) [GCC 7.3.0]
GPU 0: GeForce RTX 2080 Ti
PyTorch: 1.6.0+cu101
TorchVision: 0.7.0+cu101
CUDA 10.1
CuDNN 7.6.3
OpenCV: 4.5.2
MMCV: 1.2.4
MMDetection: 2.11.0+41bb93f

最终的配置文件

测试

sh main.sh
得到B榜的测试结果 prediction_result/result.json

训练

sh train.sh

解决方案（实验迭代过程）：

基于swin-transformer 进行算法迭代

注意：测试采用的是多尺度测试(TTA)

img_scale=[(1333, 480), (1333, 640), (1333, 800)] + hflip(水平翻转)

baseline: cascade_mask_rcnn_swin_small_fpn + ms(480-672) + nms(0.5) + epoch:12
- 其中， ms指的是多尺度训练， nms(0.5): 使用nms, iou_thre等于0.5

A榜结果：0.67286122814

基于baseline: 为了提高模型的召回率，用soft_nms替换nms, 其中iou_thre:0.5，以及, 为了使模型对小物体有更好的性能，增大多尺度训练的范围 ms(480-800)

A榜结果：0.68311035012，提升1.1%

基于2
- 因为该任务的评价指标是 AP(IoU=0.5:0.05:0.95)，所以要求更精确的检测结果。基于此，调整cas_iou(0.5, 0.6, 0.7) --> cas_iou(0.55, 0.65, 0.75)

A榜结果：0.68516692196，提升0.2%

基于3
- 考虑到FPN (特征金字塔网络)只有一条从上到下的路径，对于不同层的特征融合能力比较差；为了增强不同层之间的信息融合，在FPN的基础上，增加一条从下到上的路径，即PAFPN

A榜结果：0.68235109092，降低0.3%，结果反而降低了。。。说明在neck上做改进，并不能带来提升。

基于3
- 为了让模型更充分的利用训练数据，增加训练轮数，epoch:20

A榜结果：0.68555370639 提升0.04%，提升微乎其微。。。

基于3
- swin_base模型bbox_head部分的回归损失使用的是giou loss, 所以依次尝试iou loss, smooth_l1 loss。

通过实验，iou loss使结果降低，而smooth l1 loss使精度提升了0.1%， 0.68665009

基于6
- rpn部分的MaxIoUAssigner换成ATSSAssigner

A榜结果：0.68672692813 提升很小。。。

基于7
- 为了使每个roi获得全局上下文信息，加入gc(global context)。

A榜结果：0.68421612819 降了0.35%，一味的加入上下文信息，对此任务并没有用。

基于7
- 根据论文SWA 中的介绍，这是一种无痛涨点法。采用余弦退火学习率额外训练模型12个epoch，然后平均每个epoch训练得到的weights作为最终的模型。
  swa + epoch:12

A榜结果：0.68918544278 提升0.24%, 果然有用。

开始尝试其他模型：(为了模型融合) 10. cascade_mask_rcnn_swin_tiny_fpn + casiou(0.55-0.75) + ms(480-800) + AdamW(0.0001) + weight_decay(0.05) + fp16

bs:2 + soft_nms(0.5) + smoothl1 loss + atss(k=9) + epoch:12

A榜结果：0.69098631098 惊讶~~~， swin-tiny这么强的吗。。。

基于10.
- 既然，swin-tiny这么强，那试试swa + epoch:12

A榜结果：0.68884048720 结果反而降了0.21%，可见， swa也不是万能的，还是要看任务以及模型。。

尝试swin-base cascade_mask_rcnn_swin_base_fpn + casiou(0.55-0.75) + ms(480-800) + AdamW(0.0001) + weight_decay(0.05) + fp16 + bs:1

soft_nms(0.5) + smoothl1 loss + atss(k=9) + epoch:12

A榜结果：0.68463508458

基于12
- swa + epoch:12

A榜结果：0.68434781735

单模最高的是swin-tiny, A榜达到0.69098631098

为了提高模型的鲁棒性，进行模型融合

a.
- swin_tiny 0.69098631098
- swin_small(swa) 0.68918544278
- 采用soft_nms(0.5)方式
- A榜结果：0.69504450825 提升0.41%
b.
- swin_tiny 0.69098631098
- swin_small(swa) 0.68918544278
- swin_base 0.68463508458
- 采用soft_nms(0.5)方式
- A榜结果：0.69234975154
c.
- swin_tiny 0.69098631098
- swin_small(swa) 0.68918544278
- 融合方式： wbf: [1, 1] iou_thr:0.6 conf_type:avg
- A榜结果： 0.67128827358
d.
- swin_tiny 0.69098631098
- swin_small(swa) 0.68918544278
- 融合方式：nmw: [1, 1] iou_thr: 0.5
- A榜结果： 0.69068316921
e.
- swin_tiny 0.69098631098
- swin_small(swa) 0.68918544278
- swin_base(swa) 0.68434781735
- 融合方式：soft_nms(0.5)
- A榜结果： 0.69531461879（A榜最高） — B榜结果： 0.68663301

为了进一步提高精度，采用4尺度测试 + hflip(水平翻转)

test scale: [(1333, 480), (1333, 576), (1333, 704), (1333, 800)]
- swin_tiny 0.69098631098
- swin_small(swa) 0.68918544278
- swin_base(swa) 0.68434781735
- 融合方式：soft_nms(0.5) — B榜结果： 0.68726892619 最终的B榜成绩

coco模型权重下载链接

参考链接

实例分割模型融合

代码目录

/data 
├── raw_data            (数据集)
|   |—— train     (训练集目录)    
|   |—— test      (测试集目录）   
├── user_data           (用户中间数据目录)
├── prediction_result   (预测结果输出文件夹)
├── code                (代码文件夹）
├── main.sh             (预测脚本)
|—— train.sh            (训练脚本）
|—— run.sh              (启动预测脚本）
└── README.md

CarryHJR / mouth_Instance_Segement

团队介绍：

B榜结果： 0.68726892619，排名第二

环境信息

最终的配置文件

测试

训练

解决方案（实验迭代过程）：

基于swin-transformer 进行算法迭代

coco模型权重下载链接

参考链接

代码目录

About

Languages

团队介绍：

B榜结果： 0.68726892619， 排名第二

环境信息

最终的配置文件

测试

训练

解决方案（实验迭代过程）：

基于swin-transformer 进行算法迭代

coco模型权重下载链接

参考链接

代码目录

About

Languages

B榜结果： 0.68726892619，排名第二