leaderj1001 / bag-of-rl

Bag of Reinforcement Learning Algorithm

actor-critic ppo pytorch reinforcement-learning

Bag of Reinforcement Learning Algorithm

Methods

Actor Critic
Actor Critic Experience Replay
Advantage Actor Critic
Asynchronous Advantage Actor Critic
Deep Deterministic Policy Gradient
Generalized Advantage Estimation
N-steps Advantage Actor Critic
Proximal Policy Optimization (PPO)
PPO Generalized Advantage Estimation
PPO LSTM
Q Learning
REINFORCE
REINFORCE Moving Average Baseline
Soft Actor Critic

Reference

About

Bag of Reinforcement Learning Algorithm

actor-critic ppo pytorch reinforcement-learning

MIT License

Languages

Language:Python 100.0%