2noise / ChatTTS

A generative speech model for daily dialogue.

Home Page:https://2noise.com

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

zero-shot 在不同环境下同样的音频采样值不一样

superstring opened this issue · comments

通过下述代码进行采样:

spk_smp = chat.sample_audio_speaker(load_audio(audio_path, 24000))

采样的结果在本地没有问题,在基于pytorch/pytorch:2.1.0-cuda11.8-cudnn8-runtime 镜像的容器中会短一点,然后生成的音频有很明显的噪音

因为该采样实质是经过DVAE做的编码,其输出结果与环境(CPU/GPU/显卡型号)有关。