boyu-ai / Hands-on-RL

https://hrl.boyuai.com/

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

关于环境初始化的一点提示

Summer907 opened this issue · comments

0.26.0以上版本的gym对一些函数做出了改动,这一点在 #50 有被提到过,并给出了修改方法:

  1. # env.seed(0)改为env.reset(seed=0)
  2. state = env.reset()下一行添加一行state = state[0]
  3. next_state, reward, done, _ = env.step(action)等号左边添加一个, _,即新版函数增加了一个输出

Originally posted by @wulidede in #50 (comment)

注意到env.reset()除了在定义环境的时候使用过,在训练过程中也有所涉及,因此第7、8、9章代码的训练部分,以及rl_utils.py中的对应部分也要改为env.reset(seed=0)。修改后,在CartPole-v0环境中的训练结果更好,且结果固定。如图:
output1
output