daidaiershidi / PaddleVideo

Comprehensive, latest, and deployable video deep learning algorithm, including video recognition, action localization, and temporal action detection tasks. It's a high-performance, light-weight codebase provides practical models for video understanding research and application

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

English | 中文

PaddleVideo

近期活动

🌟 1月17号-21号《产业级视频技术与应用案例》 🌟

  • 【1月17号20:15-21:30】视频技术导论及医疗行业典型案例
  • 【1月18号20:15-21:30】视频内容智能分析和生产解决方案
  • 【1月19号20:15-21:30】体育+安全防范行业中的行为识别
  • 【1月20号20:15-21:30】顶会冠军视频分割算法深度解密
  • 【1月21号20:15-21:30】多模态学习和检索方法

👀 报名链接: https://paddleqiyeban.wjx.cn/vj/QIValIZ.aspx?udsid=419689 课程回放链接: https://aistudio.baidu.com/aistudio/course/introduce/6742

💖 欢迎大家扫码入群讨论 💖

  • 添加成功后回复【视频】加入交流群

简介

python version paddle version

PaddleVideo是飞桨官方出品的视频模型开发套件,旨在帮助开发者更好的进行视频领域的学术研究和产业实践。


模型案例库

模型

行为识别方法
PP-TSM (PP series) PP-TSN (PP series) PP-TimeSformer (PP series) TSN (2D’) TSM (2D‘)
SlowFast (3D’) TimeSformer (Transformer‘) VideoSwin (Transformer’) AttentionLSTM (RNN‘)
基于骨骼点的动作识别方法
ST-GCN (Custom’) AGCN (Adaptive‘)
时序动作检测方法
BMN (One-stage‘)
时空动作检测方法
SlowFast+Fast R-CNN
多模态
ActBERT (Learning‘) T2VLAD (Retrieval‘)
视频目标分割
CFBI (Semi‘) MA-Net (Supervised‘)
单目深度估计
ADDS (Unsupervised‘)

数据集

动作识别
Kinetics-400 (Homepage) (CVPR'2017) UCF101 (Homepage) (CRCV-IR-12-01) ActivityNet (Homepage) (CVPR'2015) YouTube-8M (Homepage) (CVPR'2017)
动作定位
ActivityNet (Homepage) (CVPR'2015)
时空动作检测
AVA (Homepage) (CVPR'2018)
基于骨架的动作识别
NTURGB+D (Homepage) (IEEE CS'2016) FSD (Homepage)
单目深度估计
Oxford-RobotCar (Homepage) (IJRR'2017)
文本视频检索
MSR-VTT (Homepage) (CVPR'2016)
文本视频预训练
HowTo100M (Homepage) (ICCV'2019)

应用案例

Applications Descriptions
FootballAction 足球动作检测方案
BasketballAction 篮球动作检测方案
TableTennis 乒乓球动作识别方案
FigureSkating 花样滑冰动作识别方案
VideoTag 3000类大规模视频分类方案
MultimodalVideoTag 多模态视频分类方案
VideoQualityAssessment 视频质量评估方案
PP-Care 3DMRI医疗图像识别方案
EIVideo 视频交互式分割工具
Anti-UAV 无人机检测方案
AbnormalActionDetection 异常行为检测方案

文档教程

赛事支持

许可证书

本项目的发布受Apache 2.0 license许可认证。

致谢

About

Comprehensive, latest, and deployable video deep learning algorithm, including video recognition, action localization, and temporal action detection tasks. It's a high-performance, light-weight codebase provides practical models for video understanding research and application

License:Apache License 2.0


Languages

Language:Python 95.5%Language:Shell 2.9%Language:C++ 1.3%Language:CMake 0.3%