关于cmvn使用的几个问题，还请指导

Question

关于cmvn使用的几个问题，还请指导

l2009312042 opened this issue a year ago · comments

l2009312042 commented a year ago

1、从提供的example中，hey snips 和hi xiaowen 使用了cmvn归一化，而speech command v1没有使用，请问这有什么讲究吗？
2、如果训练集的数据分布，和测试场景的数据分布不一致，此时使用cmvn技术，请问有哪些建议？
（比如训练集使用不同类型的手机收集，而测试场景是一些低端mic采集的声音，用在一些玩具上的语音识别）
直接收集部分测试场景数据，离线计算cmvn？但是此种方式无法穷举不同mic采集声音的类型，不同的mic 采集的声音分布不同，这个如何去应对，有没有妙计？
还是动态计算cmvn值？
异或者直接使用训练集的cmvn值？

Menglong Xu · Answer 1 · Sun May 14 2023 11:20:04 GMT+0800 (China Standard Time)

如果只是用开源的数据的话加不加cmvn对结果的影响不大
直接使用训练集的cmvn值，但这种情况下单独靠 cmvn 效果也不会太好。建议用测试场景的 mic 转录一部分训练数据，增加训练集的多样性。