lhwcv / DTLN_pytorch

Dual-signal Transformation LSTM Network, PyTorch,NCNN

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

关于NCNN模型量化的问题

Plutoisme opened this issue · comments

作者您好,我最近一直在复现这篇DTLN—NS和DTLN-AEC的论文,也成功参考您的部署实现在开发板上运行。目前还想要再提高运行效率,想采用量化的方式。 目前的困境是如果使用torch.quantization导出的torchin8模型不能经过ncnn模型转换,而如果使用ncnn本身的量化工具(https://github.com/Tencent/ncnn/blob/master/docs/how-to-use-and-FAQ/quantized-int8-inference.md) 的话,其需要一个校准集合,说白点就是感觉推理框架MNN,NCNN的量化工具都是为了图像算法而设计的。 感觉您对语音及ncnn这个框架挺熟悉的,不知道您对音频算法在ncnn上的量化方案有什么建议呢?

该校准集合是需要一堆图片,通过Opencv的imread读取生成RGB三通道或者Gray单通道。 以Pytorch_DTLN_P1_stateful这个类为例,我也想过将输入的mag转化成图片存入JPEG格式中构造校准数据集,但是mag的值跟图片的值他们的值域不一样啊,这条路好像是走不通的。