Xiaobin-Rong / gtcrn

The official implementation of GTCRN, an ultra-lite speech enhancement model.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

48k_training

FisherDom opened this issue · comments

你好!多谢你的工作及开源!如果我想使用48k采样率,需要对模型代码进行修改吗,还是只需要改变输入数据即可。
祝您工作顺利!

你好!转换到48k是需要修改模型的。对于48k数据,如果STFT沿用32ms帧长的设置,频率维度将会是769个点而不是257个点。需要考虑以下几个改动:

  1. 在频谱压缩BM模块,对多少kHz以下的频带不压缩?
  2. 输入的频谱通过Encoder之后,频率维度是多少?要相应地调整Bottleneck的G-DPRNN的参数;

可能还存在其它我没考虑到的修改,祝你工作顺利!