Hugging Robot Learning

该项目旨在梳理应用于连续动作空间控制的强化学习、模仿学习、以及离线强化学习相关算法，方便进一步学习。

在之前两版本梳理之后，发现，完全根据综述梳理会造成知识不够具体。因此，接下来准备更关注经典算法，而不是单纯的综述。

内容一直在修改，博客中内容为最新版 ❗❗❗

本项目计划分为三个阶段，分别是

知识梳理阶段主要关注知识框架的搭建；算法复现阶段主要关注经典算法的代码复现；项目优化阶段主要关注知识完整性和准确性、排版整洁性、以及代码准确性。

欢迎批评指正～

欢迎一起做项目～

内容导航

章节	内容
第一章	DDPMs：去噪扩散概率模型

章节	内容
第一章	MCAC：蒙特卡洛增强的Actor-Critic算法
第二章	SDQN：连续性动作的离散化序列预测