zero-shot 在不同环境下同样的音频采样值不一样
superstring opened this issue · comments
萧石逸 commented
通过下述代码进行采样:
spk_smp = chat.sample_audio_speaker(load_audio(audio_path, 24000))
采样的结果在本地没有问题,在基于pytorch/pytorch:2.1.0-cuda11.8-cudnn8-runtime 镜像的容器中会短一点,然后生成的音频有很明显的噪音
源文雨 commented
因为该采样实质是经过DVAE做的编码,其输出结果与环境(CPU/GPU/显卡型号)有关。