图像具体操作可以参看compute.py。
其中包含了图像尺寸变换、NMS
,IOU
等核心计算方式。
图像统一处理变换为
- 正方形填充
- 尺寸缩放
anchor变换为
- 填充裁剪
- 图形归一化恢复
标注格式为(center_x, center_y, w, h)
,且为归一化的值。
预测坐标为(x_1, y_1, x_2, y_2)
,且在标准的(416 x 416)
的尺度上,需要进行坐标转换。
实际标注格式为
(class, center_x, center_y, w, h)
,取bbox
时候需要注意。
标注的解析可以查看dataset.py,里面有解析办法.
预测bbox
的转换,逻辑计算和坐标转换都在compute.py