whisper-server

以下只针对 Windows 版本的部署

使用 openai whisper 进行语音转文本，然后再提交到翻译服务制作双语字幕

后续的机翻功能会用到，还需要配合 OpenAI 的 GPT（也许是某个其他的第三方服务）做翻译服务。

安装支持

首先在物理机安装：

CUDA 11.7
CUDNN 8

然后记得把 CUDNN 的 bin 目录加入到环境变量。然后重启。

然后安装 ffmpeg

建议使用 conda 建立虚拟环境

# 安装 torch GPU 版本
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117

# 安装 whisperx 核心
pip install git+https://github.com/m-bain/whisperx.git@v3

# 或者是更新 whisperx 核心
pip install git+https://github.com/m-bain/whisperx.git@v3 --upgrade

# 日志库
pip install loguru
# flask
pip install flask

可能遇到的问题

Q：解决cudnn_cnn_infer64_8.dll 不在path中

A：去这个地方下载 https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html#install-zlib-windows 得到 zlib123dllx64.zip 文件。然后解压得到 zlibwapi.dll，放到系统的 PATH 目录中（我个人放到了 CUDNN 目录中）

Q：安装完支持库后，运行提示 CUDA 无法启用什么的

A：再重装一次 torch···pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117

About

使用 openai whisper 进行 V2T，然后再提交到翻译服务制作双语字幕

Languages

Language:Python 99.5%Language:Batchfile 0.5%