wenetspeech数据集

Question

wwfcnu opened this issue 2 months ago · comments

这个数据集中有9000多小时无标签的数据，这部分数据在哪可以获取呢

夜雨飘零 · Answer 1 · Sun Jun 16 2024 11:28:07 GMT+0800 (China Standard Time)

一样是在下载的数据集里面的，按照下面判断划分获取就行

text = segment_file['text']
confidence = segment_file['confidence']