simonliu009 / TTS-for-GPT-soVITS

这是一个简单的TTS后端项目 基于https://github.com/RVC-Boss/GPT-SoVITS 并提供了一些推理优化的特性/This is a simple TTS backend project based on https://github.com/RVC-Boss/GPT-SoVITS and provides some inference optimization features:

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

介绍

这是一个后端项目

基于https://github.com/RVC-Boss/GPT-SoVITS 实现了一个Flask框架的简单后端,并将推理函数拆分到不同文件利于管理

可以实现快速切换人物

安装方式

对于安装

我们可以看看 https://www.yuque.com/xter/zibxlp/nqi871glgxfy717e

这个中文文档会更加详细

推荐做法:

对于一个已经能正常运行的GPT-soVITS项目

将项目文件拷入根目录

或使用git,需要保证根目录下类似这样的文件结构

并且pip install -r requirements_added.txt

等待安装完成安装完成

然后就是可以正常的使用,导入模型后看下方如何使用环节

独立安装:

不推荐!!!

这个东西更多请当成插件使用

整合包:

在弄,等一等

导入模型

!注意,这个不同于主项目,而是将模型以人物卡的形式导入

image.png

在trained文件夹,通过子文件夹的形式导入人物

文件夹要求

文件夹名称就是人物名称

image.png

里面应该至少有3个文件

pth/ckpt/wav后缀名结尾

并且wav的文件名就是它包含的文字内容

这样软件就会自动在这个文件夹中生成一个infer_config.json

{
  "ref_wav_path": "./trained/paimeng/既然罗莎莉亚说足迹上有元素力,用元素视野应该能很清楚地看到吧。.wav",
  "prompt_text": "既然罗莎莉亚说足迹上有元素力,用元素视野应该能很清楚地看到吧。",
  "prompt_language": "中文",
  "text_language": "中文",
  "gpt_path": "./trained/paimeng/paimeng2-e50.ckpt",
  "sovits_path": "./trained/paimeng/paimeng_e75_s81900.pth"
}

也可以手动编辑来指定路径

如果因为调整其中文件导致出现问题,请手动删去infer_config.json,软件会重新生成

*如何指定默认角色

trained文件夹下有一个character_info.json 通过修改它可以改变默认角色

{
"deflaut_character":"hutao"
}

如何使用

.\runtime\python.exe .\inference_backend.py调用或者直接双击bat即可 image.png

阅读3.0配置使用例

比如用阅读3.0

https://github.com/gedoor/legado

image.png

在朗读引擎中加入对应人名的朗读引擎

如图配置 image.png

http://192.168.0.106:5000/tts,
{
    "method": "POST",
    "body": {
        "cha_name": "hutao",
        "text": "{{java.encodeURI(speakText)}}"
    }
}

调整链接为你的挂载点

api

它默认运行在5000端口,挂载点是例如[http://192.168.0.106:5000/tts](http://192.168.0.106:5000/tts,)

接受的数据

最少项:

{
    "method": "POST",
    "body": {
       
        "text": "{{java.encodeURI(speakText)}}"
    }
}

详细选项

{
    "method": "POST",
    "body": {
        "cha_name": "hutao",
        "text": "{{java.encodeURI(speakText)}}",
        "top_k": 3,
        "top_p": 0.6,
        "temperature": 0.6
    }
}

其中text是必要项

cha_name可选,请确保在trained中存在对应模型,不指定则使用默认模型

其它参数如果不知道怎么指定,可以不指定

返回的数据

返回audio/wav

About

这是一个简单的TTS后端项目 基于https://github.com/RVC-Boss/GPT-SoVITS 并提供了一些推理优化的特性/This is a simple TTS backend project based on https://github.com/RVC-Boss/GPT-SoVITS and provides some inference optimization features:


Languages

Language:Python 99.7%Language:Batchfile 0.3%