2noise / ChatTTS

A generative speech model for daily dialogue.

Home Page:https://2noise.com

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

作者你好,请教一下,生成多段音频的时候,有时候每段音频听起来空间感不一样呢?比如第一段听起来声音清脆一些,第二段听起来低沉一些

xiaoxiaotestnote opened this issue · comments

作者你好,请教一下,生成多段音频的时候,有时候每段音频听起来空间感不一样呢?比如第一段听起来声音清脆一些,第二段就肯能低沉一些,这个有什么优化的方法吗?

音色没固定

音色没固定

那如何固定呢?音色听起来是一个人,就是感觉声音的空间不一样

这是模型自身的问题导致的,原因是训练时同一个spk_emb可能对应多个人声。后续可能会调整训练数据集后发布优化的模型。