jkcox2016 / Bert-VITS2

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Bert-VITS2

VITS2 Backbone with bert

本项目fork自Stardust-minus/Bert-VITS2,现可以直接fork并训练。

严禁将此项目用于一切违反《中华人民共和国宪法》,《中华人民共和国刑法》,《中华人民共和国治安管理处罚法》和《中华人民共和国民法典》之用途。

严禁用于任何政治相关用途

本地部署

1.安装相应python,cuda,cudnn,pytorch(gpu)(自行寻找教程),下载对应依赖和模型包

1.1 可以使用虚拟环境,在虚拟环境安装torch,在终端将requirements.txt里的依赖进行安装:

pip install -r requirements.txt

在终端验证torch版本是否正确:

pip list

屏幕截图 2023-09-20 115825

1.2 到hugging face下载对应的bert模型到bert文件里,中文日文,对照一下,把带LFS后缀的或者说缺失的下载下来。

1.3 验证模型是否工作正常,打开text文件夹下的chinese_bert.py、japanese.py和japanese_bert.py,将代码中的路径修改为下载的对应的中日文的bert模型目录,运行尝试一下,print出1024日志,说明是正常的。

1.4 下载底模,新建logs文件夹,在logs文件夹下新建一个文件夹(自行命名),放入文件夹。

2. 数据集收集与处理

2.1 数据集收集,获取你想要克隆的人物角色的音频

2.2 进行预处理,去除噪声,背景音乐,分段并打标,新建raw文件夹,在raw文件夹下创建一个新文件夹,自行命名,然后将处理后音频文件放入其中,再将打标生成的.list文件放入filelists文件夹下,修改成对应的名字。

2.3 clean原始文案,打开preprocess_text.py,将

 default="filelists/genshin.list",

里的路径进行修改,然后运行。

2.4 重采样,打开resample.py,运行。

2.5 生成bert相关信息,打开bert_gen.py,根据电脑配置修改

   parser.add_argument("--num_processes", type=int, default=2)

里面的数字以提高速度,运行,如果报错,查看

    if hps.data.add_blank:

修改为:

    if True:

3.开始训练

3.1 打开configs文件夹下的config.json文件,根据配置修改epochs与batch_size,

3.2 在终端开始训练

py .\train_ms.py -m YourModelName -c configs/config.json

4.推理

4.1 打开webui.py,修改

     "-m", "--model", default="./logs/as/G_8000.pth", help="path of your model"

为你logs目录下的模型文件,运行。

References

About

License:GNU Affero General Public License v3.0


Languages

Language:Python 100.0%