Paulzzzhang / ProjectLog

项目进展日志

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

ProjectLog

项目日志

语音识别的一些基础知识 本项目主要内容在于孤立词的评分以及其发音反馈,其中功能将逐步实现

由于需要部署到小程序,因此有域名www.kaldi-speech.cn

现在主要工作在于自己实现DTW与HMM-DNN,对比其效率 后期将选择使用Kaldi进行进一步的模型训练

目前主要方向以及进度

单词评分

实现方法

  1. MFCC简单教程
    python_speech_features官方使用文档
    使用Python_speech_features进行MFCC提取
    MFCC的提取过程讲解
    MFCC各种教程 动态时间规整
    DTW MFCC和DTW的实现

    结果说明:无法定量的描述相对的评分,最终得到的是两者特征向量的平均匹配值,无法达到预想的使用标准,可以直接放弃

  2. HMM的简单说明

句子评分

重点在于流畅度等

About

项目进展日志


Languages

Language:Python 100.0%