ShengtongZhu / reinforcement-learning

Reinforcement Learning Examples Of Policy Gradients, PPO+GAE, and DDQN Using OpenAI Gym and PyTorch

https://medium.com/geekculture/a-simple-guide-to-reinforcement-learning-with-the-super-mario-bros-environment-495a13974a54

Reinforcement Learning Examples

Pong environment

Policy Gradients
Checkpoint weights

Lunar Lander environment

Deep Q-Network
Checkpoint weights

Policy Gradients
Checkpoint weights

Cartpole environment

Policy Gradients
Checkpoint weights

Deep Q-Network
Checkpoint weights

Mario environment

Policy Gradients
Checkpoint weights

Plot of average reward per 10 episodes

Double Deep Q-Network
Checkpoint weights

Plot of average reward per 10 episodes

PPO+GAE
Checkpoint weights

Plot of average reward per 10 episodes

Highway environments

Highway environnment

video.mp4

Double Deep Q-Network
Checkpoint weights

Merge environnment

video.mp4

Double Deep Q-Network
Checkpoint weights

Roundabout environnment

video.mp4

Double Deep Q-Network
Checkpoint weights

Intersection environnment

video.mp4

Double Deep Q-Network
Checkpoint weights

Parking environnment

video.mp4

PPO+GAE
Checkpoint weights

PyBullet Walker2D environment

video.mp4

PPO+GAE
Checkpoint weights

Plot of average reward per 50 episodes

About

Reinforcement Learning Examples Of Policy Gradients, PPO+GAE, and DDQN Using OpenAI Gym and PyTorch

https://medium.com/geekculture/a-simple-guide-to-reinforcement-learning-with-the-super-mario-bros-environment-495a13974a54

Apache License 2.0

Languages

Language:Python 100.0%