datawhalechina / easy-rl

强化学习中文教程（蘑菇书🍄），在线阅读地址：https://datawhalechina.github.io/easy-rl/

datawhalechina/easy-rl Issues

Typo 汇总
Updated a month ago1
PPO算法的实现, 为啥要给概率取对数?
Closed a month ago2
/chapter14/chapter14
Closed a month ago
/chapter14/chapter14
Closed a month ago
/chapter14/chapter14
Updated a month ago
《9.3 优势演员-评论员算法》的公式（9.3）错误
Closed a month ago3
TypeError: __init__() got an unexpected keyword argument 'new_step_api'
Closed 2 months ago3
notebooks/Q-learning/QLearning.ipynb的绘图代码存在一个小瑕疵
Closed 2 months ago1
怎么在Linux服务器上运行demo程序？
Updated 2 months ago2
连续动作空间的PPO算法
Closed 3 months ago2
关于条件全期望公式的推导的问题
Closed 4 months ago1
纸质版是怎么做的？
Closed 4 months ago1
dqn算法问题
Closed 5 months ago
the version of numpy
Closed 6 months ago
关于书中DDPG算法的疑问
Updated 9 months ago
DDPG算法实现出现问题
Closed 9 months ago
图6.8左下角标识应该是“动作价值(Q)”?
Closed 9 months ago1
我在运行DQN代码时，初始的state总会多一个值。
Closed 9 months ago
DuelingDQN.ipynb中可能存在的两个BUG~
Updated a year ago
添加参考文献
Closed a year ago1
4.3 REINFORCE：蒙特卡洛策略梯度
Closed a year ago1
错别字
Closed a year ago2
最新的版本，可以出PDF吗
Closed a year ago2
value_iteration 算法不收敛？
Updated a year ago1
随书代码在哪
Closed a year ago6
内容勘误？
Closed a year ago3
SAC代码问题
Closed a year ago2
第五章勘误
Closed a year ago1
Edit problem in Chapter3
Closed a year ago1
第四章图4.10标注是不是有误？
Closed a year ago1
1.7.1 Gym示例返回值增多了
Closed a year ago3
DoubleDQN的upadate()中的reward_batch少了.unsqueeze(1)
Closed 2 years ago1
DoubleDQN和DQN的update函数代码好像是一样的
Closed 2 years ago1
Spelling mistake
Updated 2 years ago1
MonteCarlo code error
Updated 2 years ago1
PPO advantage calculation
Closed 2 years ago1
Tutorial Notebook broken (Colab)
Closed 2 years ago1
能否提供代码中主要库的版本
Closed 2 years ago2
请问以后会增加MARL算法吗？
Closed 2 years ago1
Q-learning 出错
Closed 2 years ago1
conda的环境需要换成python==3.8了
Closed 2 years ago1
common文件夹里是不是少个py文件呀
Closed 2 years ago2
DQN代码错误
Closed 2 years ago1
“3.3.1 蒙特卡洛策略评估”中经验均值问题
Closed 2 years ago3
书写错误
Closed 2 years ago1
TD3 目标策略平滑化的工作原理和原始论文描述不一致
Closed 2 years ago1
PPO算法状态问题
Closed 2 years ago1
电子书图片标注问题
Closed 2 years ago1
内存使用超出预期
Updated 2 years ago
大佬，为啥我总是显示common.utils调用失败啊
Closed 2 years ago1