time seqenence len diff

Question

JaggerZr opened this issue a year ago · comments

您好，在使用您的代码时发现，hubert处理后的24层数据的fps是150fps，而您给的标签是25fps的，我看到您打代码中有rate除，但是发现最终结果predict和label的时间长度不一致，我的疑问是dtw做为loss时要保证时间长度不一致吗？输入的150fps的特征是正确的吗？

Qi Chen · Answer 1 · Mon Oct 09 2023 17:39:00 GMT+0800 (China Standard Time)

您好，hubert处理后的数据应该是50fps的，而mfcc处理后的数据是100fps的，您能否再检查一下呢？另外pred和label的时间长度可以不一致，正因此我们才用了DTW loss

JaggerZr · Answer 2 · Mon Oct 09 2023 21:13:08 GMT+0800 (China Standard Time)

抱歉，我找到问题所在了，我使用的音频文件是48khz，导致出现了hubert出现150hz的错误。

Qi Chen · Answer 3 · Mon Oct 09 2023 21:14:39 GMT+0800 (China Standard Time)

好的，那我关闭这个issue了