a. 在同一个目录下创建asr, kaldi两个子目录,其中kaldi子目录为kaldi源码
i. kaldi子目录
1) git clone https://github.com/kaldi-asr/kaldi.git
2) 完成编译
ii. asr子目录
1) 下载[asr_sample.tar.gz](https://pan.baidu.com/s/11Mxz6W1Z39-JkNbU8w_MAQ)(密码发邮件至mezixun@foxmail.com获取) 解压后的文件目录结构如下:
xx/speech
kaldi
README.md
INSTALL
COPYING
egs
misc
scripts
windows
tools
src
asr
words.txt
final.mdl
HCLG.fst
fbank.conf
online.conf
run.sh
data
wav
T0001W0001.wav
spk.scp
wav.scp
b. 在asr子目录下运行run.sh,加载模型,跑出样例结果
Client/Service(SDK / Service)
i. 采集语音信号及音频信号相关处理,熟悉WebRTC
i. 音频按照帧分割,流式调用服务器,每次上传一个时间片段的音频帧数据,最后一次会增加一个完成状态标记。服务器接收到找个状态标记,输出完整的ASR识别结果。
http://kaldi-asr.org/doc/index.html
http://kaldi-asr.org/doc/dnn.html
http://www.cnblogs.com/welen/p/7567741.html