Kedreamix's repositories

Linly-Talker

Digital Avatar Conversational System - Linly-Talker. 😄✨ Linly-Talker is an intelligent AI system that combines large language models (LLMs) with visual models to create a novel human-AI interaction method. 🤝🤖 It integrates various technologies like Whisper, Linly, Microsoft Speech Services, and SadTalker talking head generation system. 🌟🔬

Language:PythonLicense:MITStargazers:804Issues:15Issues:37

Pytorch-Image-Classification

用于pytorch的图像分类,包含多种模型方法,比如AlexNet,VGG,GoogleNet,ResNet,DenseNet等等,包含可完整运行的代码。除此之外,也有colab的在线运行代码,可以直接在colab在线运行查看结果。也可以迁移到自己的数据集进行迁移学习。

Language:Jupyter NotebookStargazers:165Issues:2Issues:3

PaddleAvatar

你是否曾经幻想过与自己的虚拟人交互?现在,使用PaddleAvatar,您可以将自己的图像、音频和视频转化为一个逼真的数字人视频,与其进行人机交互。 PaddleAvatar是一种基于PaddlePaddle深度学习框架的数字人生成工具,基于Paddle的许多套件,它可以将您的数字图像、音频和视频合成为一个逼真的数字人视频。除此之外,PaddleAvatar还支持进一步的开发,例如使用自然语言处理技术,将数字人视频转化为一个完整的人机交互系统,使得您能够与虚拟的自己进行真实的对话和互动。 使用PaddleAvatar,您可以将数字人视频用于各种场合,例如游戏、教育、虚拟现实等等。PaddleAvatar为您提供了一个自由创作的数字世界,让您的想象力得到了充分的释放!

Language:Jupyter NotebookStargazers:132Issues:2Issues:7

YoloGesture

基于计算机视觉手势识别控制系统YoLoGesture (利用YOLO实现),利用yolo进行手势识别的控制系统,最后利用streamlit进行了部署,可在线体验尝试https://kedreamix-yologesture.streamlit.app , huggingface也有https://huggingface.co/spaces/Kedreamix/YoloGesture ,除此之外,还可以将方法运用到其他数据集中,都可以完成目标检测任务,并且进行部署,一通百通

MAE-for-CIFAR

MAE for CIFAR,由于可用资源有限,我们仅在 cifar10 上测试模型。我们主要想重现这样的结果:使用 MAE 预训练 ViT 可以比直接使用标签进行监督学习训练获得更好的结果。这应该是自我监督学习比监督学习更有效的数据的证据。

Language:Jupyter NotebookLicense:MITStargazers:44Issues:2Issues:3

Image-Web-App-using-Streamlit

Image Web-App using Streamlit

Language:PythonStargazers:10Issues:1Issues:0

GAN_Step_By_Step

GAN Step By Step -- GSBS,顾名思义,我希望我自己能够一步一步的学习GAN。GAN 又名 生成对抗网络,是最近几年很热门的一种无监督算法,他能生成出非常逼真的照片,图像甚至视频。GAN是一个图像的全新的领域,从2014的GAN的发展现在,在计算机视觉中扮演这越来越重要的角色,并且到每年都能产出各色各样的东西,GAN的理论和发展都蛮多的。我感觉最近有很多人都在学习GAN,但是国内可能缺少比较多的GAN的理论及其实现,所以我也想着和大家一起学习,并且提供主流框架下 **pytorch,tensorflow,keras** 的一些实现教学。 在一个2016年的研讨会,`杨立昆`描述生成式对抗网络是“`机器学习这二十年来最酷的想法`”。

Language:PythonStargazers:7Issues:2Issues:0

YOLO-Object-Detection

YOLO-Object-Detection 集成多种yolo模型,作为一个模板进行目标检测

Language:PythonStargazers:5Issues:1Issues:0

Deep_learning

在这里面我会记录一下我在机器学习中一步一步的路程,我一定会慢慢努力的哈哈

Language:Jupyter NotebookStargazers:4Issues:1Issues:0

eat_tensorflow2_in_30_days

30天吃掉那只 TensorFlow2.0

PigBACSeg

基于计算机视觉的猪胴体背膘厚度检测技术(基于UNet)

weibo_monitor

weibo_monitor

Language:PythonStargazers:1Issues:1Issues:0

Awesome-GitHub-Repo

收集整理 GitHub 上高质量、有趣的开源项目。

License:CC0-1.0Stargazers:0Issues:0Issues:0
Language:PythonStargazers:0Issues:0Issues:0

CRNN-pytorch

CRNN-pytorch

Language:PythonStargazers:0Issues:1Issues:0

deep-learning-for-image-processing

deep learning for image processing including classification and object-detection etc.

Language:PythonLicense:GPL-3.0Stargazers:0Issues:0Issues:0

DiffTalk

[CVPR2023] The implementation for "DiffTalk: Crafting Diffusion Models for Generalized Audio-Driven Portraits Animation"

Language:PythonStargazers:0Issues:1Issues:0
Language:Jupyter NotebookStargazers:0Issues:0Issues:0

HDTF

the dataset and code for "Flow-guided One-shot Talking Face Generation with a High-resolution Audio-visual Dataset"

Language:PythonLicense:GPL-3.0Stargazers:0Issues:0Issues:0

huawei-od-python

华为OD算法题解 愿景:加入C++的方法,学习相关知识

Language:PythonLicense:NOASSERTIONStargazers:0Issues:0Issues:0

Keras-Image-Classification

用于keras的图像分类,包含多种模型方法,比如AlexNet,VGG,GoogleNet,ResNet,DenseNet等等,包含可完整运行的代码。除此之外,也有colab的在线运行代码,可以直接在colab在线运行查看结果。也可以迁移到自己的数据集进行迁移学习。

Stargazers:0Issues:1Issues:0
Stargazers:0Issues:1Issues:0

mmsegmentation

OpenMMLab Semantic Segmentation Toolbox and Benchmark.

Language:Jupyter NotebookLicense:Apache-2.0Stargazers:0Issues:0Issues:0

my-team-learning

我的Datawhale组队学习,在线阅读地址:https://relph1119.github.io/my-team-learning

Stargazers:0Issues:0Issues:0

PyTorch-Networks

Pytorch implementation of cnn network

Language:PythonStargazers:0Issues:0Issues:0

Pytorch-planet

什么是快乐星球?什么是快乐星球?让我来带你研究pytorch简单易懂的代码

Language:Jupyter NotebookStargazers:0Issues:1Issues:0

RealOrGPT

RealOrGPT

Stargazers:0Issues:1Issues:0

SadTalker

(CVPR 2023)SadTalker:Learning Realistic 3D Motion Coefficients for Stylized Audio-Driven Single Image Talking Face Animation

Language:PythonLicense:MITStargazers:0Issues:0Issues:0

WeightRoom

用来存放需要wget下载的部分权重文件

Language:PythonStargazers:0Issues:0Issues:0