关于环境初始化的一点提示
Summer907 opened this issue · comments
0.26.0以上版本的gym对一些函数做出了改动,这一点在 #50 有被提到过,并给出了修改方法:
# env.seed(0)
改为env.reset(seed=0)
state = env.reset()
下一行添加一行state = state[0]
next_state, reward, done, _ = env.step(action)
等号左边添加一个, _
,即新版函数增加了一个输出
Originally posted by @wulidede in #50 (comment)
注意到env.reset()
除了在定义环境的时候使用过,在训练过程中也有所涉及,因此第7、8、9章代码的训练部分,以及rl_utils.py
中的对应部分也要改为env.reset(seed=0)
。修改后,在CartPole-v0环境中的训练结果更好,且结果固定。如图: