刘悦's repositories
CosyVoice_For_Windows
CosyVoice在Windows环境下使用的版本
Modelscope_Faster_Whisper_Multi_Subtitle
基于Faster-whisper和modelscope一键生成双语字幕,双语字幕生成器,基于离线大模型,Generate bilingual subtitles with one click based on Faster-whisper and modelscope. Off-line large model
ASR_TOOLS_SenseVoice_WebUI
Bert-vits2转写和标注独立整合Webui,整合阿里FunAsr,必剪Asr以及Whisper大模型
live2d-TTS-LLM-GPT-SoVITS-Vtuber
低成本的简单基于live2d TTS文字转语音和大模型聊天的直播解决方案
OpenVoiceV2_Webui_resemble_enhance
基于OpenVoice和Melotts整合的中文版webui,添加resemble_enhance音频增强功能
llama3-txt2json-dataset-maker
文本语料转训练集工具,txt转dataset
Bert-vits2-V2.3
Bert-vits2-V2.3 训练和推理
RWKV_3B_7B_Webui_GPT-SoVITS
无内容审核写作大模型rwkv的本地webui项目,接入GPT-SoVITS
Srt_Video_Dub_TTS
鬼畜视频配音字幕同步项目,基于字幕文件srt同步接入TTS,支持GPT-Sovits ChatTTS BertVits2
Unsloth-Windows-fineTuning-Qwen2
Unsloth框架在Windows平台微调训练Qwen2大模型,非WSL
CosyVoice_for_MacOs
CosyVoice在苹果MacOs上使用的版本
rwkv.cpp_webui_GPT-SoVITS
基于rwkv.cpp项目制作webui,接入GPT-SoVITS朗读小说
RWKV_Role_Playing_with_GPT-SoVITS
基于 RWKV_Role_Playing 项目接入GPT-SoVITS语音对话项目
DCT-Net_Webui
基于DCT-Net的图片/视频转绘gradio界面webui
Bert-vits2-Extra-Stream-webui-api
基于Bert-vits2-Extra项目添加的流式推理和流式接口api功能
Fix-Loudness
音频响度统一,音量归一化处理
GPT-SoVITS_FOR_PopClip
GPT-SoVITS接入苹果MacOs效率工具PopClip
text-generation-webui-with-GPT-SoVITS
text-generation-webui插件,通过接口方式集成GPT-SoVITS,兼容Bert-vits2
rwkv.cpp_webui_Macos
基于rwkv.cpp项目制作webui,Macos运行版,接入GPT-SoVITS朗读小说
ChatTTS_colab
🚀 一键部署!基于 ChatTTS ,支持音色抽卡、长音频生成和分角色朗读。简单易用,无需复杂安装。
GPT-SoVits-Read-Aloud-FireFox
基于Read-aloud项目增加GPT-SoVits接口,FireFox扩展,大声朗读
rwkv_online
rwkv无内容审查大模型线上执行脚本
fish-speech
Brand new TTS solution
flask-vuejs3-videopro
公开课 https://space.bilibili.com/3031494/channel/collectiondetail?sid=1032778 Flask框架前后端分离项目(Vue.js3)Web开发实战系列教程 配套源码
GPT-SoVITS
1 min voice data can also be used to train a good TTS model! (few shot voice cloning)
FunClip
Open-source, accurate and easy-to-use video speech recognition & clipping tool, LLM based AI clipping intergrated.
MeloTTS
High-quality multi-lingual text-to-speech library by MyShell.ai. Support English, Spanish, French, Chinese, Japanese and Korean.
SenseVoice
Multilingual Voice Understanding Model