你好,视频配音中存在多个人物 是怎么做到不同的人说不同的音频呢?
wangwenjie1314 opened this issue · comments
文杰 commented
aidenyzhang commented
这个应该属于另一个研究领域了。
可以考虑从音频识别的角度把视频分段。
但是影视剧场景中,经常会出现A说话但是画面中的人却是B,这种场景似乎很难自动识别。
MuseTalk: Real-Time High Quality Lip Synchorization with Latent Space Inpainting
wangwenjie1314 opened this issue · comments
这个应该属于另一个研究领域了。
可以考虑从音频识别的角度把视频分段。
但是影视剧场景中,经常会出现A说话但是画面中的人却是B,这种场景似乎很难自动识别。