boyu-ai / Hands-on-RL

https://hrl.boyuai.com/

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

1.3节强化学习的环境中的公式含义不清

qixitan opened this issue · comments

在1.3节中公式
下一状态~P(.|当前状态,智能体动作)
其中当前状态是指当前智能体的当前状态还是变化环境的当前状态,或者两者都有