Wendy510 / asr

沪语(上海话)ASR(语音识别)模型

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

使用的工具库

Huggingface的transformers和huggingsound。

沪语ASR模型

包含一个沪语ASR模型(沪语语音->沪语转写文本)和机器翻译模型(沪语转写文本->普通话文本)。

数据

包含Magichub开源数据集、喜马拉雅,**语言网爬取的数据集、讯飞TTS生成的wav数据。

训练脚本

train.py 用于训练ASR模型

train_translation.py 用于训练MT模型

服务

使用fastapi进行整个模型的部署,运行run_service.sh部署。

About

沪语(上海话)ASR(语音识别)模型


Languages

Language:Python 99.4%Language:Shell 0.6%