请问有没有选项可以做到一字一断呢

Question

chenmiaomiao opened this issue a year ago · comments

我是最近才开始做视频，其实我不知道该不该一字一断，但是视频里面有些小错误我想去掉，想偷懒，不知道可不可以把模型设成一字一断或者一词一段？

如果没有的话，我大致有个思路，先按照正常的长度去识别，再把句子断开，最后把断开的句子和音频再匹配出时间。我挺想把这个想法实现一下，不知道有没有这个必要。

Jonham Chen (John Chen) · Answer 1 · Mon Mar 27 2023 13:18:08 GMT+0800 (China Standard Time)

whisper新出的API，支持word-level.

momobobe · Answer 2 · Sat Apr 22 2023 21:01:17 GMT+0800 (China Standard Time)

https://github.com/linto-ai/whisper-timestamped this one has already implemented it, so wait for any contributor to work on its adaptation @mli @yihong0618 @zcf0508