HaujetZhao / ali-audio-text-sync

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

中文 | English

Gitee | Github

阿里云自动打轴

⭐ 简介

功能: 使用阿里云智能语音服务中的录音文件识别 API,实现将视频、音频文件转写,再根据转写结果和提供的文字稿,自动给文字稿打轴(文字稿要一行一句),生成 srt 字幕。

下载:

📝 背景

群成员提了这个要求,想着可以配合 阿里云转字幕 改一下,所以做了这个命令行工具。

使用后,会自动生成 config.ini 配置文件,请根据提示,在配置文件里填写上阿里云 API 相关参数。

阿里云 api 的获取,可以参考这个 视频教程

✨ 特性

两种运行方式:

  • 直接运行,文字引导
  • 命令行运行

🛠️ 安装

📦 发行版

需要提前安装上 FFmpeg

已为 Windows 64 位打包成可直接双击运行的包,请到 本仓库的 Releases 界面下载。将 7z 压缩包解压后,文件夹内有一个 exe 文件,双击即可运行。

也可以从命令行运行:

ali-audio-text-sync

我没有其他系统(例如 Linux、MacOS)的电脑,所以无法为其他系统打包,这些系统的用户需要从源代码或 pip 安装使用。(参见下文)

⚙️ 用 pip 安装运行

需要提前安装上 FFmpeg 和 Python3

用 pip 从 pypi 安装

还未上传

用 pip 从源代码安装

将仓库克隆下来,进入仓库文件夹,运行:

pip install .

就安装上了。然后就可以运行以下命令使用了:

ali-audio-text-sync

📄 从源代码直接运行

将仓库克隆下来,进入仓库文件夹,先安装依赖库:

pip install -r requirements.txt

然后就可以以模块的方式运行:

python -m ali_audio_text_sync

💡 使用

注意:识别的音频或视频文件时长不能超过 4 个半小时。

python -m ali_audio_text_sync
python -m ali_audio_text_sync 音频.mp3 文稿.txt

第一种方式是直接运行,会有文字提示引导你:

> python -m ali_audio_text_sync

第二种方式是命令行传递参数运行:

> python -m ali_audio_text_sync -h
usage: __main__.py [-h] [--version] [-l 语言] Media Text

功能:使用阿里云智能语音服务中的录音文件识别 API,实现将视频、音频文件转写,
    再根据转写结果和提供的文字稿,自动给文字稿打轴,生成 srt 字幕。

positional arguments:
  Media                 音视频文件
  Text                  文稿的 txt 文本

optional arguments:
  -h, --help            show this help message and exit
  --version             show program's version number and exit
  -l 语言, --language 语言  使用什么引擎,默认是配置文件中的第一个 (default: )

🔋 打赏

本软件完全开源,用爱发电,如果你愿意,可以以打赏的方式为我充电:

sponsor

😀 交流

如果有软件方面的反馈可以提交 issues,或者加入 QQ 群:1146626791

About

License:Mozilla Public License 2.0


Languages

Language:Python 100.0%