夜雨飘零's repositories
Whisper-Finetune
Fine-tune the Whisper speech recognition model to support training without timestamp data, training with timestamp data, and training without speech data. Accelerate inference and support Web deployment, Windows desktop deployment, and Android deployment
VoiceprintRecognition-Pytorch
This project uses a variety of advanced voiceprint recognition models such as EcapaTdnn, ResNetSE, ERes2Net, CAM++, etc. It is not excluded that more models will be supported in the future. At the same time, this project also supports MelSpectrogram, Spectrogram data preprocessing methods
PaddlePaddle-DeepSpeech
基于PaddlePaddle实现的语音识别,中文语音识别。项目完善,识别效果好。支持Windows,Linux下训练和预测,支持Nvidia Jetson开发板预测。
AudioClassification-Pytorch
The Pytorch implementation of sound classification supports EcapaTdnn, PANNS, TDNN, Res2Net, ResNetSE and other models, as well as a variety of preprocessing methods.
VoiceprintRecognition-Tensorflow
使用Tensorflow实现声纹识别
VoiceprintRecognition-PaddlePaddle
本项目使用了EcapaTdnn、ResNetSE、ERes2Net、CAM++等多种先进的声纹识别模型,同时本项目也支持了MelSpectrogram、Spectrogram、MFCC、Fbank等多种数据预处理方法
ClassificationForAndroid
在Android使用深度学习模型实现图像识别,本项目提供了多种使用方式,使用到的框架如下:Tensorflow Lite、Paddle Lite、MNN、TNN
Pytorch-MTCNN
基于Pytorch实现的MTCNN模型,人脸检测,人脸关键点检测。
PunctuationModel
中文标点符号模型,可以给文本添加标点符号。
VoiceprintRecognition-Keras
基于Kersa实现的声纹识别模型
Pytorch-MobileFaceNet
Pytorch实现的人脸识别明细MobileFaceNet模型,在预测使用MTCNN检测人脸,然后使用MobileFaceNet模型识别。
SpeechEmotionRecognition-Pytorch
基于Pytorch实现的语音情感识别
AudioClassification-PaddlePaddle
基于PaddlePaddle实现的音频分类,支持EcapaTdnn、PANNS、TDNN、Res2Net、ResNetSE等各种模型,还有多种预处理方法
PaddlePaddle-MobileFaceNets
PaddlePaddle实现的人脸识别模型MobileFaceNets,在预测的是使用MTCNN检测人脸,然后MobileFaceNets模型识别。
PaddlePaddle-SSD
基于PaddlePaddle实现的SSD,包括MobileNetSSD,MobileNetV2SSD,VGGSSD,ResNetSSD
Tensorflow-FaceRecognition
基于MTCNN和MobileFaceNet实现的人脸识别,提供三种预测方式,满足各种需求 。
PaddlePaddle-CrowdNet
基于PaddlePaddle实现的人流密度识别模型CrowdNet
FaceKeyPointsMask
人脸检测、口罩识别、关键检测
ChangeHumanBackground
人物更换背景
Chinese-LLM-Chat
大语言模型微调的项目,包含了使用QLora微调ChatGLM和LLama
VITS-Pytorch
本项目是基于Pytorch的语音合成项目,使用的是VITS,VITS是一种语音合成方法,这种时端到端的模型使用起来非常简单,不需要文本对齐等太复杂的流程,直接一键训练和生成,大大降低了学习门槛。
CameraXApp
CameraX实现的相机
VITS-PaddlePaddle
本项目是基于PaddlePaddle的语音合成项目,使用的是VITS,VITS是一种语音合成方法,这种时端到端的模型使用起来非常简单,不需要文本对齐等太复杂的流程,直接一键训练和生成,大大降低了学习门槛。
yeyupiaoling.github.io
夜雨飘零的个人博客