NetEase-GameAI / Face2FaceRHO

The Official PyTorch Implementation for Face2Face^ρ (ECCV2022)

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

关于VoxCeleb1裁剪框选择的问题

HowieMa opened this issue · comments

非常感谢您在issue20里关于数据集大小的回复,这对我非常有帮助。但是我还有些裁剪框(bounding box)的问题没有得到您的解释。由于那个issue已经被您关闭,我只能新开一个issue,期待您的解答。

请问您用的是哪一种bounding box 从原始视频裁剪脸部区域的呢?
1)是直接从video-preprocessing 提供的 "vox-metadata.csv",
2)还是使用的VoxCeleb1 官方提供的原始bounding box 呢?

具体来说,
VoxCeleb1 官方给的boundingbox 都是正方形的,我看您的dataset demo里似乎使用的是VoxCeleb1官方的正方形框。

但是meta csv 文件里存在很多非正方形的框,如这个issue,他们会把非正方形的框给resize 到正方形,这样就会有畸变。比如您demo 里的图,直接使用video-preprocessing 的meta.csv 就会得到这样压的非常扁的图。
image
所以想找您确认一下在裁剪图片的时候使用的是哪一种bounding box,谢谢!

用的是第二种,但我这边是在其给出的bounding box的基础上对其进行了修改,不是你那的那种直接缩放,而是比如原始的框左右或者上下加一些padding的方式,保证出来的都是正方形。

明白了,非常感谢您的回复!