PPO x Family 决策智能入门公开课

欢迎来到 PPO x Family 系列决策智能入门公开课。该系列将深入理解深度强化学习算法 PPO ，灵活运用一个 PPO 算法解决几乎所有常见的决策智能应用 ，帮助一切对于深度强化学习技术有好奇心的人，轻便且高效地制作应用原型，了解和学习最强大最易用的 PPO Family 。

P.S. 路过记得点个 star ，2022年12月起持续更新中~

News

2022.12.23: PPO x Family 第三章（表征多模态观察空间）将在一月上旬上线
2022.12.23: [bilibili] PPO x Family 第二章（解构复杂动作空间）正式上线
2022.12.23: PPO x Family ”算法-代码“ 注解文档网站上线传送门
2022.12.08: [bilibili] PPO x Family 第一章（开启决策AI探索之旅）正式上线
2022.12.06: [bilibili] PPO x Family 第一章微课视频：4分钟带你快速入门强化学习的万能钥匙
2022.12.05: [PaperWeekly] 给你一个 PPO × Family 课程，撑起整个决策 AI 宇宙
2022.12.01: [bilibili] PPO x Family 课程品牌宣传视频
2022.11.30: [机器之心] 集中一点，演化无限：PPO × Family决策智能入门公开课即日开讲
2022.11.30: [**计算机学会CCF] 【CCF科普群星计划】决策智能入门公开课开课啦

课程大纲

内容导航

章节（视频课）	算法理论资料	补充资料	习题	代码样例	应用样例
第一章：开启决策AI探索之旅	课程PPT 课程文字稿	微课视频策略梯度 A2C TRPO QA总结	习题习题题解	概述课不含代码	应用混剪
第二章：解构复杂动作空间	课程PPT	重参数化 PPO&DDPG HyAR	1.3更新	离散动作示例连续动作示例混合动作示例 1.3 更新应用训练代码	火箭回收等
第三章：表征多模态动作空间（一月上旬）

课程特点

一个算法解决万千应用视频传送门

算法理论和代码实现一一对应网站传送门

项目结构

.
├── LICENSE
├── assets                       --> 相关图片素材（转载请注明来源）
├── chapter2_action              --> 课程第二章相关内容
└── chapter1_overview            --> 课程第一章相关内容
    ├── chapter1_manuscript.pdf  --> 课程第一章文字稿（对于PPT的补充说明）
    ├── chapter1_lecture.pdf     --> 课程第一章PPT
    ├── chapter1_qa.pdf          --> 课程第一章答疑文稿
    ├── chapter1_homework.pdf    --> 课程第一章习题作业
    ├── chapter1_homework_solution.pdf  --> 课程第一章习题作业题解
    ├── chapter1_supp_trpo.pdf          --> 课程第一章补充材料（算法理论推导等）
    └── chapter1_demo_code.py    --> 课程第一章相关代码实现

课程答疑和反馈

常见问题FAQ：传送门
小助手微信号：OpenDILab
Slack：OpenDILab
GitHub Issue区：链接
B站账号：OpenDILab
知乎账号：OpenDILab浦策
邮箱：opendilab@pjlab.org.cn

License

PPOxFamily is released under the Apache 2.0 license.

About

PPO x Family DRL Tutorial Course（决策智能入门级公开课：8节课帮你盘清算法理论，理顺代码逻辑，玩转决策AI应用实践）

https://opendilab.github.io/PPOxFamily/

Apache License 2.0

Languages

Language:Python 100.0%