zero-shot 在不同环境下同样的音频采样值不一样

Question

superstring opened this issue a month ago · comments

通过下述代码进行采样：

spk_smp = chat.sample_audio_speaker(load_audio(audio_path, 24000))

采样的结果在本地没有问题，在基于pytorch/pytorch:2.1.0-cuda11.8-cudnn8-runtime 镜像的容器中会短一点，然后生成的音频有很明显的噪音

源文雨 · Answer 1 · Fri Oct 18 2024 01:05:21 GMT+0800 (China Standard Time)

因为该采样实质是经过DVAE做的编码，其输出结果与环境（CPU/GPU/显卡型号）有关。