Gitee | Github

阿里云自动打轴

⭐ 简介

功能：使用阿里云智能语音服务中的录音文件识别 API，实现将视频、音频文件转写，再根据转写结果和提供的文字稿，自动给文字稿打轴（文字稿要一行一句），生成 srt 字幕。

下载：

发行版下载地址： Releases

📝 背景

群成员提了这个要求，想着可以配合阿里云转字幕改一下，所以做了这个命令行工具。

使用后，会自动生成 config.ini 配置文件，请根据提示，在配置文件里填写上阿里云 API 相关参数。

阿里云 api 的获取，可以参考这个视频教程

✨ 特性

两种运行方式：

直接运行，文字引导
命令行运行

🛠️ 安装

📦 发行版

需要提前安装上 FFmpeg

已为 Windows 64 位打包成可直接双击运行的包，请到本仓库的 Releases 界面下载。将 7z 压缩包解压后，文件夹内有一个 exe 文件，双击即可运行。

也可以从命令行运行：

ali-audio-text-sync

我没有其他系统（例如 Linux、MacOS）的电脑，所以无法为其他系统打包，这些系统的用户需要从源代码或 pip 安装使用。（参见下文）

⚙️ 用 pip 安装运行

需要提前安装上 FFmpeg 和 Python3

用 pip 从 pypi 安装

还未上传

用 pip 从源代码安装

将仓库克隆下来，进入仓库文件夹，运行：

pip install .

就安装上了。然后就可以运行以下命令使用了：

ali-audio-text-sync

📄 从源代码直接运行

将仓库克隆下来，进入仓库文件夹，先安装依赖库：

pip install -r requirements.txt

然后就可以以模块的方式运行：

python -m ali_audio_text_sync

💡 使用

注意：识别的音频或视频文件时长不能超过 4 个半小时。

python -m ali_audio_text_sync
python -m ali_audio_text_sync 音频.mp3 文稿.txt

第一种方式是直接运行，会有文字提示引导你：

> python -m ali_audio_text_sync

第二种方式是命令行传递参数运行：

> python -m ali_audio_text_sync -h
usage: __main__.py [-h] [--version] [-l 语言] Media Text

功能：使用阿里云智能语音服务中的录音文件识别 API，实现将视频、音频文件转写，
    再根据转写结果和提供的文字稿，自动给文字稿打轴，生成 srt 字幕。

positional arguments:
  Media                 音视频文件
  Text                  文稿的 txt 文本

optional arguments:
  -h, --help            show this help message and exit
  --version             show program's version number and exit
  -l 语言, --language 语言  使用什么引擎，默认是配置文件中的第一个 (default: )

🔋 打赏

本软件完全开源，用爱发电，如果你愿意，可以以打赏的方式为我充电：

😀 交流

如果有软件方面的反馈可以提交 issues，或者加入 QQ 群：1146626791

HaujetZhao / ali-audio-text-sync