question

Question

question

ljingv opened this issue 3 years ago · comments

“Our experi- ments show that MixTraining can appreciably improve the performance of leading object detectors such as Faster R-CNN [24] with a ResNet-50 [13] backbone (from 41.7 mAP to 44.0 mAP) and Cascade R-CNN [1] with the Swin-Transformer [22] backbone (from 50.9 mAP to 52.8 mAP).”

1.usually，the map of faster-rcnn-r50 map is 36.5, so what's the difference?

"All the models run on 32×Nvidia V100."

32 means 32G or 4x8?
180K means how much epochs?

zy · Answer 1 · Thu Jan 06 2022 00:03:16 GMT+0800 (China Standard Time)

32 是32张卡吧。

代码里写了每卡2张图，因此batchsize=32*2=64，
根据iters * batchsize = epochs * num_images估算:
epochs = 180k * (32*2)/ 118k = 98
因此180K对应的schedule是 8x

那720K岂不是，，，，32x? 不知道推错了没有，但愿能解答楼主的问题。

zy · Answer 2 · Thu Jan 06 2022 00:05:32 GMT+0800 (China Standard Time)

顺便借楼问问，论文为何没有像一般的目标检测论文一样，报告AP_90, AP_s/m/l 的实验结果

Xu Mengde · Answer 3 · Thu Jan 06 2022 00:14:07 GMT+0800 (China Standard Time)

你没算错，baseline最长跑了384epoch...但是这个时候其实已经overfit了。

顺便借楼问问，论文为何没有像一般的目标检测论文一样，报告AP_90, AP_s/m/l 的实验结果

这个没明白是啥意思，一般不会报AP_90吧，一般都是AP_50,AP_75。AP_s/m/l倒是确实没报。

zy · Answer 4 · Thu Jan 06 2022 00:28:05 GMT+0800 (China Standard Time)

十分感谢作者深夜解答！我担心的点在于数据集中的大多数未打标签的目标都是小目标，生成的强标签势必会多很多小目标的标注，这样会不会导致学生网络误推理出很多小目标（数据集中未标注的），导致小目标的假阳性很高，进而影响AP_s

Xu Mengde · Answer 5 · Thu Jan 06 2022 00:31:14 GMT+0800 (China Standard Time)

我不太确定，明天看下实验记录再回复你。

zy · Answer 6 · Thu Jan 06 2022 00:32:13 GMT+0800 (China Standard Time)

万分感谢！

Xu Mengde · Answer 7 · Thu Jan 06 2022 14:35:40 GMT+0800 (China Standard Time)

确实有一些差别。
比如
frcnn_swinsmall上s,m,l的提升分别是1.1，1.9，1.7，cascasde_swinsmall上的提升是
1.7,2.5,2.4。

zy · Answer 8 · Thu Jan 06 2022 15:18:08 GMT+0800 (China Standard Time)

效果也很好！感谢！