joneswong / pytorch-policy-gradient-example

A toy example of Policy Gradient implemented in Pytorch

pytorch-policy-gradient-example

Train an agent for CartPole-v0 using naive Policy Gradient.

Inspired by Andrej Karpathy's blog.

Code partly from Pytorch DQN Tutorial

Solved in 500 episodes (Avg Reward):

About

A toy example of Policy Gradient implemented in Pytorch

MIT License

Languages

Language:Python 100.0%