abeardear / pytorch-YOLO-v1

an experiment for yolo-v1, including training and testing.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

你的resnet50作为backbone时,输入(3,448,448)的图片,输出维度不是(7,7,30)!

07hyx06 opened this issue · comments

S那里是不是就有问题

作者复现时进行了改进感觉是把特征图尺寸设置为14x14

的確,雖然作者在註解部分都寫 grid size 為 7x7x30,但實際上程式的寫法都是 14x14x30,
我想會這麼做應該是因為作者提高了輸入的尺寸(448x448),使得 resnet50 的輸出會變成 14x14x30。

最后边改了,用的是卷积层而不是全连接层

commented

我说,看了半天,注释跟代码没对应上

Resnet原论文的输入是224224,对应输出77,因此448输出是14*14的feature map

准确地来说不是有问题,是这个代码是预训练代码,应该还要有一个微调部分,预训练输入是224,微调才是448