阿里云自动打轴
⭐ 简介
功能: 使用阿里云智能语音服务中的录音文件识别 API,实现将视频、音频文件转写,再根据转写结果和提供的文字稿,自动给文字稿打轴(文字稿要一行一句),生成 srt 字幕。
下载:
- 发行版下载地址: Releases
📝 背景
群成员提了这个要求,想着可以配合 阿里云转字幕 改一下,所以做了这个命令行工具。
使用后,会自动生成 config.ini
配置文件,请根据提示,在配置文件里填写上阿里云 API 相关参数。
阿里云 api 的获取,可以参考这个 视频教程
✨ 特性
两种运行方式:
- 直接运行,文字引导
- 命令行运行
🛠️ 安装
📦 发行版
需要提前安装上 FFmpeg
已为 Windows 64 位打包成可直接双击运行的包,请到 本仓库的 Releases 界面下载。将 7z 压缩包解压后,文件夹内有一个 exe 文件,双击即可运行。
也可以从命令行运行:
ali-audio-text-sync
我没有其他系统(例如 Linux、MacOS)的电脑,所以无法为其他系统打包,这些系统的用户需要从源代码或 pip 安装使用。(参见下文)
⚙️ 用 pip 安装运行
需要提前安装上 FFmpeg 和 Python3
用 pip 从 pypi 安装
还未上传
用 pip 从源代码安装
将仓库克隆下来,进入仓库文件夹,运行:
pip install .
就安装上了。然后就可以运行以下命令使用了:
ali-audio-text-sync
📄 从源代码直接运行
将仓库克隆下来,进入仓库文件夹,先安装依赖库:
pip install -r requirements.txt
然后就可以以模块的方式运行:
python -m ali_audio_text_sync
💡 使用
注意:识别的音频或视频文件时长不能超过 4 个半小时。
python -m ali_audio_text_sync
python -m ali_audio_text_sync 音频.mp3 文稿.txt
第一种方式是直接运行,会有文字提示引导你:
> python -m ali_audio_text_sync
第二种方式是命令行传递参数运行:
> python -m ali_audio_text_sync -h
usage: __main__.py [-h] [--version] [-l 语言] Media Text
功能:使用阿里云智能语音服务中的录音文件识别 API,实现将视频、音频文件转写,
再根据转写结果和提供的文字稿,自动给文字稿打轴,生成 srt 字幕。
positional arguments:
Media 音视频文件
Text 文稿的 txt 文本
optional arguments:
-h, --help show this help message and exit
--version show program's version number and exit
-l 语言, --language 语言 使用什么引擎,默认是配置文件中的第一个 (default: )
🔋 打赏
本软件完全开源,用爱发电,如果你愿意,可以以打赏的方式为我充电:
😀 交流
如果有软件方面的反馈可以提交 issues,或者加入 QQ 群:1146626791