simonliu009/TTS-for-GPT-soVITS

介绍

这是一个后端项目

基于https://github.com/RVC-Boss/GPT-SoVITS 实现了一个Flask框架的简单后端，并将推理函数拆分到不同文件利于管理

可以实现快速切换人物

安装方式

对于安装

我们可以看看 https://www.yuque.com/xter/zibxlp/nqi871glgxfy717e

这个中文文档会更加详细

独立安装：

不推荐！！！

这个东西更多请当成插件使用

整合包：

在弄，等一等

导入模型

！注意，这个不同于主项目，而是将模型以人物卡的形式导入

在trained文件夹，通过子文件夹的形式导入人物

文件夹要求

文件夹名称就是人物名称

里面应该至少有3个文件

以pth/ckpt/wav后缀名结尾

并且wav的文件名就是它包含的文字内容

这样软件就会自动在这个文件夹中生成一个infer_config.json

{
  "ref_wav_path": "./trained/paimeng/既然罗莎莉亚说足迹上有元素力，用元素视野应该能很清楚地看到吧。.wav",
  "prompt_text": "既然罗莎莉亚说足迹上有元素力，用元素视野应该能很清楚地看到吧。",
  "prompt_language": "中文",
  "text_language": "中文",
  "gpt_path": "./trained/paimeng/paimeng2-e50.ckpt",
  "sovits_path": "./trained/paimeng/paimeng_e75_s81900.pth"
}

也可以手动编辑来指定路径

如果因为调整其中文件导致出现问题，请手动删去infer_config.json，软件会重新生成

*如何指定默认角色

在trained文件夹下有一个character_info.json 通过修改它可以改变默认角色

{
"deflaut_character":"hutao"
}

如何使用

用.\runtime\python.exe .\inference_backend.py调用或者直接双击bat即可

阅读3.0配置使用例

比如用阅读3.0

https://github.com/gedoor/legado

在朗读引擎中加入对应人名的朗读引擎

如图配置

http://192.168.0.106:5000/tts,
{
    "method": "POST",
    "body": {
        "cha_name": "hutao",
        "text": "{{java.encodeURI(speakText)}}"
    }
}

调整链接为你的挂载点

api

它默认运行在5000端口，挂载点是例如[http://192.168.0.106:5000/tts](http://192.168.0.106:5000/tts,)

接受的数据

最少项：

{
    "method": "POST",
    "body": {
       
        "text": "{{java.encodeURI(speakText)}}"
    }
}

详细选项

{
    "method": "POST",
    "body": {
        "cha_name": "hutao",
        "text": "{{java.encodeURI(speakText)}}",
        "top_k": 3,
        "top_p": 0.6,
        "temperature": 0.6
    }
}

其中text是必要项

cha_name可选，请确保在trained中存在对应模型，不指定则使用默认模型

其它参数如果不知道怎么指定，可以不指定

返回的数据

返回audio/wav

About

这是一个简单的TTS后端项目基于https://github.com/RVC-Boss/GPT-SoVITS 并提供了一些推理优化的特性/This is a simple TTS backend project based on https://github.com/RVC-Boss/GPT-SoVITS and provides some inference optimization features:

Languages

Language:Python 99.7%Language:Batchfile 0.3%

simonliu009 / TTS-for-GPT-soVITS

介绍