fishaudio / fish-speech

Brand new TTS solution

Home Page:https://speech.fish.audio

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

[BUG]使用API接口进行推理,参考音频是女生,生成的是男生

wuye901126 opened this issue · comments

commented

使用API接口进行推理,参考音频是女生,生成的是男生

有更多的信息吗? 比如参考音频, 模型版本等.

commented

都是用的默认的,在webui 上推理正常Api 上面就没效果

commented

准确来说,应该是设置了参考音频,但是没有生效

commented

还有更多信息吗?例如参考音频、模型版本等。

python -m tools.api --listen 0.0.0.0:8000 --llama-checkpoint-path "checkpoints/text2semantic-sft-medium-v1.1-4k.pth" --llama-config-name dual_ar_2_codebook_medium --decoder-checkpoint-path "checkpoints/vq-gan-group-fsq-2x1024.pth" --decoder-config-name vqgan_pretrain 使用的是这个命令启动的

commented

有更多的信息吗? 比如参考音频, 模型版本等.

添加了参考音频,但是生成出来的音频应该是使用了随机音频