gxt-kt/video-subtitle-generator

Video-subtitle-generator (vsg) 是一款将视频中的语音提取为外挂字幕文件(srt格式)的软件。

源码使用说明

运行要求：需要Nvidia GPU显卡（显存大于1G可使用base模型，大于5G可使用medium模型，大于10G可使用large模型）

（1）切换到源码所在目录：

cd <源码所在目录>

例如：如果你的源代码放在D盘的tools文件下，并且源代码的文件夹名为video-subtitle-generator，就输入 cd D:/tools/video-subtitle-generator-main

（2）创建激活conda环境

conda create -n vsgEnv python=3.8

conda activate vsgEnv

请确保你已经安装 python 3.8+，使用conda创建项目虚拟环境并激活环境 (建议创建虚拟环境运行，以免后续出现问题)

安装依赖：

pip install -r requirements.txt

python backend/main.py

    # 1.指定音视频文件路径
    wav_path = './test/test.flv'
    # 2. 新建字幕提取器
    sg = SubtitleGenerator(wav_path)
    # 3. 运行字幕生成
    ret = sg.run()

修改settings.ini中的Mode，取值为：base, medium, large，即可使用对应的识别模型

视频音频转字幕，生成srt文件。无需申请第三方API，本地实现音频转文本。基于Transformer的视频字幕生成框架。A tool for generating subtitle from videos and generating srt files.

Apache License 2.0

Language:Python 100.0%