[BUG]使用API接口进行推理，参考音频是女生，生成的是男生

Question

[BUG]使用API接口进行推理，参考音频是女生，生成的是男生

wuye901126 opened this issue 23 days ago · comments

Aump commented 23 days ago

使用API接口进行推理，参考音频是女生，生成的是男生

Leng Yue · Answer 1 · Fri May 17 2024 18:25:39 GMT+0800 (China Standard Time)

有更多的信息吗? 比如参考音频, 模型版本等.

Aump · Answer 2 · Fri May 17 2024 18:51:01 GMT+0800 (China Standard Time)

都是用的默认的，在webui 上推理正常Api 上面就没效果

Aump · Answer 3 · Fri May 17 2024 18:52:49 GMT+0800 (China Standard Time)

准确来说，应该是设置了参考音频，但是没有生效

Aump · Answer 4 · Mon May 20 2024 09:28:43 GMT+0800 (China Standard Time)

还有更多信息吗？例如参考音频、模型版本等。

python -m tools.api --listen 0.0.0.0:8000 --llama-checkpoint-path "checkpoints/text2semantic-sft-medium-v1.1-4k.pth" --llama-config-name dual_ar_2_codebook_medium --decoder-checkpoint-path "checkpoints/vq-gan-group-fsq-2x1024.pth" --decoder-config-name vqgan_pretrain 使用的是这个命令启动的

Aump · Answer 5 · Mon May 20 2024 11:20:07 GMT+0800 (China Standard Time)

有更多的信息吗? 比如参考音频, 模型版本等.

添加了参考音频，但是生成出来的音频应该是使用了随机音频