PaddlePaddle Models

PaddlePaddle provides a rich set of computational units to enable users to adopt a modular approach to solving various learning problems. In this repo, we demonstrate how to use PaddlePaddle to solve common machine learning tasks, providing several different neural network model that anyone can easily learn and use.

fluid models: use PaddlePaddle's Fluid APIs. We especially recommend users to use Fluid models.

PaddlePaddle 提供了丰富的计算单元，使得用户可以采用模块化的方法解决各种学习问题。在此repo中，我们展示了如何用 PaddlePaddle 来解决常见的机器学习任务，提供若干种不同的易学易用的神经网络模型。PaddlePaddle用户现可申请AI Studio平台的免费Tesla V100算力资源，高效在线训练模型，点击申请。

fluid模型: 使用 PaddlePaddle Fluid版本的 APIs，我们特别推荐您使用Fluid模型。

PaddleCV

模型	简介	模型优势	参考论文
AlexNet	图像分类经典模型	首次在CNN中成功的应用了ReLU、Dropout和LRN，并使用GPU进行运算加速	ImageNet Classification with Deep Convolutional Neural Networks
VGG	图像分类经典模型	在AlexNet的基础上使用3*3小卷积核，增加网络深度，具有很好的泛化能力	Very Deep ConvNets for Large-Scale Inage Recognition
GoogleNet	图像分类经典模型	在不增加计算负载的前提下增加了网络的深度和宽度，性能更加优越	Going deeper with convolutions
ResNet	残差网络	引入了新的残差结构，解决了随着网络加深，准确率下降的问题	Deep Residual Learning for Image Recognition
Inception-v4	图像分类经典模型	更加deeper和wider的inception结构	Inception-ResNet and the Impact of Residual Connections on Learning
MobileNet	轻量级网络模型	为移动和嵌入式设备提出的高效模型	MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications
DPN	图像分类模型	结合了DenseNet和ResNeXt的网络结构，对图像分类效果有所提升	Dual Path Networks
SE-ResNeXt	图像分类模型	ResNeXt中加入了SE block，提高了模型准确率	Squeeze-and-excitation networks
SSD	单阶段目标检测器	在不同尺度的特征图上检测对应尺度的目标,可以方便地插入到任何一种标准卷积网络中	SSD: Single Shot MultiBox Detector
YOLOv3	单阶段目标检测器	基于darknet53主干网络在多种尺度的特征图上进行端到端实时目标检测,检测速度快	YOLOv3: An Incremental Improvement
Face Detector: PyramidBox	基于SSD的单阶段人脸检测器	利用上下文信息解决困难人脸的检测问题，网络表达能力高，鲁棒性强	PyramidBox: A Context-assisted Single Shot Face Detector
Faster RCNN	典型的两阶段目标检测器	创造性地采用卷积网络自行产生建议框，并且和目标检测网络共享卷积网络，建议框数目减少，质量提高	Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
Mask RCNN	基于Faster RCNN模型的经典实例分割模型	在原有Faster RCNN模型基础上添加分割分支，得到掩码结果，实现了掩码和类别预测关系的解藕。	Mask R-CNN
ICNet	图像实时语义分割模型	即考虑了速度，也考虑了准确性，在高分辨率图像的准确性和低复杂度网络的效率之间获得平衡	ICNet for Real-Time Semantic Segmentation on High-Resolution Images
DCGAN	图像生成模型	深度卷积生成对抗网络，将GAN和卷积网络结合起来，以解决GAN训练不稳定的问题	Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks
ConditionalGAN	图像生成模型	条件生成对抗网络，一种带条件约束的GAN，使用额外信息对模型增加条件，可以指导数据生成过程	Conditional Generative Adversarial Nets
CycleGAN	图片转化模型	自动将某一类图片转换成另外一类图片，可用于风格迁移	Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks
CRNN-CTC模型	场景文字识别模型	使用CTC model识别图片中单行英文字符	Connectionist Temporal Classification: Labelling Unsegmented Sequence Data with Recurrent Neural Networks
Attention模型	场景文字识别模型	使用attention 识别图片中单行英文字符	Recurrent Models of Visual Attention
Metric Learning	度量学习模型	能够用于分析对象时间的关联、比较关系，可应用于辅助分类、聚类问题，也广泛用于图像检索、人脸识别等领域	-
TSN	视频分类模型	基于长范围时间结构建模，结合了稀疏时间采样策略和视频级监督来保证使用整段视频时学习得有效和高效	Temporal Segment Networks: Towards Good Practices for Deep Action Recognition
视频模型库	视频模型库	给开发者提供基于PaddlePaddle的便捷、高效的使用深度学习算法解决视频理解、视频编辑、视频生成等一系列模型
caffe2fluid	将Caffe模型转换为Paddle Fluid配置和模型文件工具	-	-

PaddleNLP

模型	简介	模型优势	参考论文
Transformer	机器翻译模型	基于self-attention，计算复杂度小，并行度高，容易学习长程依赖，翻译效果更好	Attention Is All You Need
BERT	语义表示模型	在多个 NLP 任务上取得 SOTA 效果，支持多卡多机训练，支持混合精度训练	BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
ERNIE	语义表示模型	基于知识增强的中文语义表示模型，在多个任务上的效果超越 BERT 中文模型	-
ELMo	语义表示模型	支持多卡训练，训练速度比主流实现快1倍，提供在中文词法分析任务上迁移学习的示例。	ELMo: Embeddings from Language Models
LAC	联合的词法分析模型	能够整体性地完成中文分词、词性标注、专名识别任务	Chinese Lexical Analysis with Deep Bi-GRU-CRF Network
Senta	情感倾向分析模型集	百度AI开放平台中情感倾向分析模型	-
DAM	语义匹配模型	百度自然语言处理部发表于ACL-2018的工作,用于检索式聊天机器人多轮对话中应答的选择	Multi-Turn Response Selection for Chatbots with Deep Attention Matching Network
SimNet	语义匹配框架	使用SimNet构建出的模型可以便捷的加入AnyQ系统中，增强AnyQ系统的语义匹配能力	-
DuReader	阅读理解模型	百度MRC数据集上的机器阅读理解模型	-
dialogue model	知识驱动的对话模型	基于双向RNN和attention实现的生成式对话系统	-

PaddleRec

模型	简介	模型优势	参考论文
TagSpace	文本及标签的embedding表示学习模型	应用于工业级的标签推荐，具体应用场景有feed新闻标签推荐等	#TagSpace: Semantic embeddings from hashtags
GRU4Rec	个性化推荐模型	首次将RNN（GRU）运用于session-based推荐，相比传统的KNN和矩阵分解，效果有明显的提升	Session-based Recommendations with Recurrent Neural Networks
SSR	序列语义检索推荐模型	使用参考论文中的**，使用多种时间粒度进行用户行为预测	Multi-Rate Deep Learning for Temporal Recommendation
DeepCTR	点击率预估模型	只实现了DeepFM论文中介绍的模型的DNN部分，DeepFM会在其他例子中给出	DeepFM: A Factorization-Machine based Neural Network for CTR Prediction
Multiview-Simnet	个性化推荐模型	基于多元视图，将用户和项目的多个功能视图合并为一个统一模型	A Multi-View Deep Learning Approach for Cross Domain User Modeling in Recommendation Systems

Other Models

模型	简介	模型优势	参考论文
DeepASR	语音识别系统	利用Fluid框架完成语音识别中声学模型的配置和训练，并集成 Kaldi 的解码器	-
DQN	深度Q网络	value based强化学习算法，第一个成功地将深度学习和强化学习结合起来的模型	Human-level control through deep reinforcement learning
DoubleDQN	DQN的变体	将Double Q的想法应用在DQN上，解决过优化问题	Font Size: Deep Reinforcement Learning with Double Q-Learning
DuelingDQN	DQN的变体	改进了DQN模型，提高了模型的性能	Dueling Network Architectures for Deep Reinforcement Learning

License

This tutorial is contributed by PaddlePaddle and licensed under the Apache-2.0 license.

许可证书

此向导由PaddlePaddle贡献，受Apache-2.0 license许可认证.

SunGaofeng / models