关于VoxCeleb1裁剪框选择的问题

Question

关于VoxCeleb1裁剪框选择的问题

HowieMa opened this issue a year ago · comments

非常感谢您在issue20里关于数据集大小的回复，这对我非常有帮助。但是我还有些裁剪框(bounding box)的问题没有得到您的解释。由于那个issue已经被您关闭，我只能新开一个issue，期待您的解答。

请问您用的是哪一种bounding box 从原始视频裁剪脸部区域的呢？
1）是直接从video-preprocessing 提供的 "vox-metadata.csv",
2）还是使用的VoxCeleb1 官方提供的原始bounding box 呢？

具体来说，
VoxCeleb1 官方给的boundingbox 都是正方形的，我看您的dataset demo里似乎使用的是VoxCeleb1官方的正方形框。

但是meta csv 文件里存在很多非正方形的框，如这个issue，他们会把非正方形的框给resize 到正方形，这样就会有畸变。比如您demo 里的图，直接使用video-preprocessing 的meta.csv 就会得到这样压的非常扁的图。

所以想找您确认一下在裁剪图片的时候使用的是哪一种bounding box，谢谢！

NetEase-GameAI · Answer 1 · Mon Mar 20 2023 18:41:11 GMT+0800 (China Standard Time)

用的是第二种，但我这边是在其给出的bounding box的基础上对其进行了修改，不是你那的那种直接缩放，而是比如原始的框左右或者上下加一些padding的方式，保证出来的都是正方形。

Haoyu Ma · Answer 2 · Tue Mar 21 2023 05:04:12 GMT+0800 (China Standard Time)

明白了，非常感谢您的回复！