policy-gradients

There are 1 repository under policy-gradients topic.

Reinforcement-Learning
andri27-ts / Reinforcement-Learning
Learn Deep Reinforcement Learning in 60 days! Lectures & Code in Python. Reinforcement Learning + Deep Learning
a2c artificial-intelligence deep-learning deep-reinforcement-learning deepmind dqn evolution-strategies machine-learning policy-gradients ppo qlearning reinforcement-learning
Language:Jupyter Notebook 4097
seungeunrho / minimalRL
Implementations of basic RL algorithms with minimal lines of codes! (pytorch based)
deep-reinforcement-learning pytorch simple deep-learning a3c ppo a2c reinforce acer dqn ddpg policy-gradients reinforcement-learning machine-learning sac
Language:Python 2731
sudharsan13296 / Hands-On-Reinforcement-Learning-With-Python
Master Reinforcement and Deep Reinforcement Learning using OpenAI Gym and TensorFlow
reinforcement-learning deep-reinforcement-learning sarsa q-learning policy-gradients deep-q-network deep-learning-algorithms asynchronous-advantage-actor-critic deep-deterministic-policy-gradient deep-recurrent-q-network double-dqn dueling-dqn hindsight-experience-replay drqn trpo ppo monte-carlo markov-decision-processes policy-gradient openai-gym
Language:Jupyter Notebook 820
deepanshut041 / Reinforcement-Learning
Implementations of Deep Reinforcement Learning Algorithms and Bench-marking with PyTorch
deep-reinforcement-learning policy-gradients monte-carlo actor-critic sarsa a2c ppo dqn pytorch reinforcement-learning ddqn reinforce ddpg t3d sac atari2600 vizdoom sonic-the-hedgehog
Language:Jupyter Notebook 92
cyoon1729 / Policy-Gradient-Methods
Implementation of Algorithms from the Policy Gradient Family. Currently includes: A2C, A3C, DDPG, TD3, SAC
a2c a3c ddpg policy-gradients pytorch pytorch-rl reinforcement-learning soft-actor-critic td3
Language:Jupyter Notebook 87
LxzGordon / Deep-Reinforcement-Learning-with-pytorch
Basic reinforcement learning algorithms. Including:DQN,Double DQN, Dueling DQN, SARSA, REINFORCE, baseline-REINFORCE, Actor-Critic,DDPG,DDPG for discrete action space, A2C, A3C, TD3, SAC, TRPO
pytorch algorithm reinforcement-learning dqn ddpg actor-critic policy-gradients a2c a3c sac td3 double-dqn dueling-dqn sarsa trpo
Language:Python 82
garlicdevs / Fruit-API
A Universal Deep Reinforcement Learning Framework
reinforcement-learning reinforcement-learning-algorithms multiplayer-game deep-reinforcement-learning deep-learning multi-agent-reinforcement-learning multi-agent multi-objective-optimization human games environment arcade-learning-environment atari actor-critic-algorithm actor-critic policy-gradients human-in-the-loop
Language:Python 65
artem-oppermann / Deep-Reinforcement-Learning
A collection of several Deep Reinforcement Learning techniques (Deep Q Learning, Policy Gradients, ...), gets updated over time.
deep-reinforcement-learning ai-agents q-learning deep-q-learning policy-gradients open-ai-gym
Language:Python 34
MahanFathi / Model-Based-RL
Model-based Policy Gradients
model-based reinforcement-learning backpropagation mujoco mujoco-py finite-difference computational-graphs pytorch gym openai-gym ilqg direct-policy-search policy-optimization policy-gradient ilqg-mujoco ilqr mujoco-dynamics policy-gradients computation-graph
Language:Python 29
hvishal512 / CS6700-Reinforcement-Learning
Artificial Intelligence series
reinforcement-learning iitm bandit-algorithms qlearning sarsa sarsa-lambda options-framework dqn-tensorflow puddle-world policy-gradient policy-iteration gradient-descent course policy-gradients
Language:Jupyter Notebook 17
nslyubaykin / relax
ReLAx - Reinforcement Learning Applications Library
ppo policy-gradients reinforcementlearning dqn trpo categorical-dqn ddpg td3 sac dyna-q mbpo model-based-rl n-step-bootstrapping rainbow-dqn
Language:Python 16
stewy33 / pong-with-policy-gradients
Code for an intro to RL workshop. You'll be training a simple agent to play pong using policy gradients. Adapted from http://karpathy.github.io/2016/05/31/rl/
policy-gradients pong pytorch reinforcement-learning rl-workshop tensorboard
Language:Python 15
arjuntheprogrammer / TheSchoolOfAI
Projects for The School of AI
neural-architecture batch-normalization regularization data-augmentation superconvergence inception-network densenet transfer-learning yolo face-recognition enas alphazero policy-gradients rnn lstm-and-gru autoencoders gan siamese-network
Language:Jupyter Notebook 6
NickKaparinos / Stanford-CS-234-RL-2022
Solutions to the Stanford CS:234 Reinforcement Learning 2022 course assignments.
bandit-algorithm deep-reinforcement-learning dqn policy-gradients pytorch stanford-university
Language:Python 1
thedatamonk / Unity-Continuous-Control
Project 2 of Udacity Deep Reinforcement Learning Nanodegree
ddpg-algorithm policy-gradients udacity
Language:Jupyter Notebook 1
97jay / DOOM-Game
The objective of this project is to develop an autonomous agent to perform well in the first person shooting games using various reinforcement learning techniques.
reinforce-algorithm policy-gradients
Language:Python 0
escribano89 / reacher-ddpg
Udacity Deep Reinforcement Learning Nanodegree. Second Project Implementation (Continuous Control).
reinforcement-learning deep-learning deep-reinforcement-learning policy-gradients deep-deterministic-policy-gradient
Language:Python 0
kaixi-wang / deep-learning-notebooks
Exploring the fundamentals of neural networks
neural-networks gans reinforcement-learning policy-gradients computer-vision natural-language-processing
Language:HTML 0
livankrekh / WalkingMarvin
Remember the sad Marvin from "Hitchhiker's guide to the galaxy"? In this project we train him to walk from the scratch using only pure python with numpy!
reinforcement-learning deep-learning from-scratch bipedalwalker 42projects openai-gym openai-gym-environment policy-gradients
Language:Python 0
nisch100 / Reinforcement_Learning
Implementations of Rl algorithms ranging from Q-learning to Multi-Agent RL using DDPG in unity and gym environments.
reinforcement-learning ddpg-agent policy-gradients openai-gym actor-critic
Language:Jupyter Notebook 0
ViRu-ThE-ViRuS / desTROY
Self Play Actor Critic, Reinforcement Learning on TROY; all puns intended
machine-learning policy-gradients pygame pytorch reinforcement-learning
Language:Python 0
bay3s / reinforce-rl
Vanilla Policy Gradient (REINFORCE) implementation with PyTorch
policy-gradients python pytorch reinforce reinforcement-learning vanilla-policy-gradient
Language:Jupyter Notebook
yahsiuhsieh / two-link-arm
Policy Gradients, DDPG, and TD3 in gym env
ddpg td3 policy-gradients reinforcement-learning
Language:Python

policy-gradients

andri27-ts / Reinforcement-Learning

seungeunrho / minimalRL

sudharsan13296 / Hands-On-Reinforcement-Learning-With-Python

deepanshut041 / Reinforcement-Learning

cyoon1729 / Policy-Gradient-Methods

LxzGordon / Deep-Reinforcement-Learning-with-pytorch

garlicdevs / Fruit-API

artem-oppermann / Deep-Reinforcement-Learning

MahanFathi / Model-Based-RL

hvishal512 / CS6700-Reinforcement-Learning

nslyubaykin / relax

stewy33 / pong-with-policy-gradients

arjuntheprogrammer / TheSchoolOfAI

NickKaparinos / Stanford-CS-234-RL-2022

thedatamonk / Unity-Continuous-Control

97jay / DOOM-Game

escribano89 / reacher-ddpg

kaixi-wang / deep-learning-notebooks

livankrekh / WalkingMarvin

nisch100 / Reinforcement_Learning

ViRu-ThE-ViRuS / desTROY

bay3s / reinforce-rl

yahsiuhsieh / two-link-arm