lee7de / Personalized-Text-to-Speech-with-Chinese

个性化语音合成——根据给定文字合成一段指定音色的语音

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

个性化语音合成

  • 又叫做语音克隆
  • 特别致谢:这个项目是在lturing的开源项目项目的基础上进行的,在数据工程、模型结构、训练、部署等方面做了不同程度的改进。感谢作者、感谢互联网分享。
  • 原项目解读:
    • master分支:采用开源语音数据集标贝(女声),得到预训练TacotronV2模型
    • adaptive分支:可配置超参数,从而利用指定说话人的少量数据微调预训练的Tacotron模型,从开源语音数据集thchs30中选择了D8(男声),一共250句

项目思路

  • 效率工具
  • 组合模型
    • 分词模型
    • 编解码器

典型处理流程

  • 数据采集与预处理
  • 模型微调
  • 模型部署使用

参考资料

  • #TODO

About

个性化语音合成——根据给定文字合成一段指定音色的语音


Languages

Language:Python 99.9%Language:Shell 0.1%