作者你好，请教一下，生成多段音频的时候，有时候每段音频听起来空间感不一样呢？比如第一段听起来声音清脆一些，第二段听起来低沉一些

Question

xiaoxiaotestnote opened this issue 2 months ago · comments

作者你好，请教一下，生成多段音频的时候，有时候每段音频听起来空间感不一样呢？比如第一段听起来声音清脆一些，第二段就肯能低沉一些，这个有什么优化的方法吗？

heart18z · Answer 1 · Fri Aug 30 2024 09:45:45 GMT+0800 (China Standard Time)

音色没固定

xiaoxiaotestnote · Answer 2 · Fri Aug 30 2024 17:04:27 GMT+0800 (China Standard Time)

音色没固定

那如何固定呢？音色听起来是一个人，就是感觉声音的空间不一样

源文雨 · Answer 3 · Fri Aug 30 2024 17:44:46 GMT+0800 (China Standard Time)

这是模型自身的问题导致的，原因是训练时同一个spk_emb可能对应多个人声。后续可能会调整训练数据集后发布优化的模型。