wenet-e2e / wekws

Production First and Production Ready End-to-End Keyword Spotting Toolkit

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

关于cmvn使用的几个问题,还请指导

l2009312042 opened this issue · comments

1、从提供的example中,hey snips 和hi xiaowen 使用了cmvn归一化,而speech command v1没有使用,请问这有什么讲究吗?
2、如果训练集的数据分布,和测试场景的数据分布不一致,此时使用cmvn技术,请问有哪些建议?
(比如训练集使用不同类型的手机收集,而测试场景是一些低端mic采集的声音,用在一些玩具上的语音识别)
直接收集部分测试场景数据,离线计算cmvn?但是此种方式无法穷举不同mic采集声音的类型,不同的mic 采集的声音分布不同,这个如何去应对,有没有妙计?
还是动态计算cmvn值?
异或者直接使用训练集的cmvn值?

  1. 如果只是用开源的数据的话 加不加cmvn对结果的影响不大
  2. 直接使用训练集的cmvn值,但这种情况下单独靠 cmvn 效果也不会太好。建议用测试场景的 mic 转录一部分训练数据,增加训练集的多样性。