skyfish-qc / wenet-online-decoder-onnx

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

wenet online onnx decoder

准备onnx模型

本系统使用wenet-onnx导出的onnx模型

  • encoder_chunk.onnx
  • decoder.onnx
  • ctc.onnnx

已准备了两个模型分别在20210204_conformer_exp和20210204_unified_transformer_exp中,可以直接进行测试,详细内容见各自的readme文件,

因无法上传100MB以上的文件到github上,请前去CSDN链接进行下载

或百度云(删除链接中 中文后 访问): 链接:https://pan盘.baidu百度.com/s/139mycaFN3JHNoY0xCHLjxw 提取码:k3gk

或在issues中留下邮箱,发送该zip文件

环境配置

torch、CUDA版本以及其他python包安装,参考wenet官方文档:https://github.com/mobvoi/wenet

文件配置

根据model_onnx_template.yaml中的描述补全lang_char.txt关键文件和onnx_model文件夹,默认模型为16k采样率数据训练所得。

系统运行

在正确的环境下直接执行python wenet_online_decoder_onnx.py,执行offline的识别 和 读取wav文件仿流式识别。

参考

本代码参考wenet_onlinedecode进行修改

21.8.14更新

  • 准备了两个模型,分别为离线conformer和在线transformer
  • 修改了对长音频的离线解码方式,使用vad来一句一句进行解码(代码不一定完善

About

License:Apache License 2.0


Languages

Language:C++ 65.8%Language:Python 24.5%Language:Perl 3.5%Language:Shell 3.2%Language:Java 0.8%Language:CMake 0.7%Language:HTML 0.5%Language:CSS 0.4%Language:JavaScript 0.3%Language:C 0.2%Language:Dockerfile 0.0%