wangshusen/DRL Issues
发现了两个小错误
Updated有没有代码示例呢 ?
Updated 3经验回放
Updated 13.4.1节动作价值函数
Updatedp101 题3答案B文字错误
Updated 3请问如何cite这本书呢?
Updated 3关于s,S与a,A间的相互转化
Updated跪求老师更新一节PPO的讲解视频
Updated 37.3.2证明中的typo
Updated 210.3.3 小节漏字
Updated7.3.2 节可能的错误
Closed 1第五章SARSA算法描述是否有误
Updated 3我不清楚这里是否写错了
Updated 4劝你识相点,给我入驻B站(手动狗头)
Updated 1github上的DRL.pdf是最新版本吗?
Updated建议增加PPO和SAC讲解
Updated 14.2.1 一术语使用不妥
Closed 2第7章视频没有公开
Updated 1感谢王先生难能可贵的分享,能否给书籍增加书签目录?
Closed 2第9章笔误及第6章疑问
ClosedNothing
Closed6.2.4 使用目标网络: 可能的错误
Updated 2可能的错误:6.2.1小节--自举导致偏差的传播
Updated 28.1节可能的小错误
Updated 1对前两章基础部分内容的读后反馈
Updated 6习题答案
Updated前9章读后感
UpdatedDouble DQN gamma 参数
Updated3.5 添加相关概念
Closed4.4 Q 学习算法 P47 落下一个字
Updated 1很不错的书,希望增加目录,还有文中公式,引用的超链接
Updated 2基于强化学习的知识图谱推理
Updated建议增加值分布强化学习的内容
Updated阅读反馈
Updated 2ImageNet 在深度学习中的应用
Updated 1确定策略梯度章节的改进建议
Updated 2TRPO中的一个小问题
Updated 64.3.1算法推导的第一个公式
Updated 3一个小typo
Closed 141页的参数更新
Closed 2Question About P48
Closed 5第四页有一处错字
Updated 3chapter4: a question about TD
Closed 2