generalized-advantage-estimation

There are 0 repository under generalized-advantage-estimation topic.

bentrevett / pytorch-rl
Tutorials for reinforcement learning in PyTorch and Gym by implementing a few of the popular algorithms. [IN PROGRESS]
pytorch pytorch-tutorial pytorch-implmention pytorch-implementation reinforcement-learning reinforcement-learning-algorithms rl pytorch-tutorials pytorch-rl policy-gradient actor-critic a2c advantage-actor-critic generalized-advantage-estimation
Language:Jupyter Notebook 251
adik993 / ppo-pytorch
Proximal Policy Optimization(PPO) with Intrinsic Curiosity Module(ICM)
reinforcement-learning ppo pytorch icm intrinsic-curiosity-module proximal-policy-optimization generalized-advantage-estimation cartpole-v1 mountaincar-v0 pendulum-v0 deep-learning
Language:Python 119
hcnoh / rl-collection-pytorch
A collection of Reinforcement Learning implementations with PyTorch
actor-critic continuous-control deep-learning deep-reinforcement-learning gae generalized-advantage-estimation openai-gym policy-gradient ppo proximal-policy-optimization pytorch reinforcement-learning trpo trust-region-policy-optimization
Language:Python 13
leaderj1001 / Phasic-Policy-Gradient
Phasic-Policy-Gradient
policy-gradient proximal-policy-optimization phasic-policy-gradient generalized-advantage-estimation
Language:Python 5
nslyubaykin / rnns_for_pomdp
Recurrent Policies for Handling Partially Observable Environments
gae generalized-advantage-estimation lstm partially-observable-environment policy-gradient pomdp ppo proximal-policy-optimization reccurent-neural-network reinforcement-learning
Language:Jupyter Notebook 2
tomasspangelo / proximal-policy-optimization
An implementation from the state-of-the-art family of reinforcement learning algorithms Proximal Policy Optimization using normalized Generalized Advantage Estimation and optional batch mode training. The loss function incorporates an entropy bonus.
deep-learning entropy generalized-advantage-estimation machine-learning open-ai open-ai-gym ppo ppo-pytorch proximal-policy-optimization python pytorch reinforcement-learning neural-network optimization gae actor-critic rl
Language:Python 2
nslyubaykin / relax_ppo_example
Example PPO implementation with ReLAx
continuous-control discrete-control gae generalized-advantage-estimation policy-gradient ppo proximal-policy-optimization reinforcement-learning reinforcement-learning-algorithms
Language:Jupyter Notebook
nslyubaykin / relax_trpo_example
Example TRPO implementation with ReLAx
gae generalized-advantage-estimation policy-gradient reinforcement-learning reinforcement-learning-algorithms trpo continuous-control discrete-control
Language:Jupyter Notebook