td3

There are 1 repository under td3 topic.

datawhalechina / easy-rl
强化学习中文教程（蘑菇书🍄），在线阅读地址：https://datawhalechina.github.io/easy-rl/
deep-reinforcement-learning reinforcement-learning dqn ppo a3c q-learning sarsa imitation-learning policy-gradient ddpg easy-rl double-dqn dueling-dqn td3
Language:Jupyter Notebook 8271
tianshou
thu-ml / tianshou
An elegant PyTorch deep reinforcement learning library.
pytorch policy-gradient dqn double-dqn a2c ddpg ppo td3 sac imitation-learning mujoco atari bcq rl drl trpo npg cql transferlab
Language:Python 7478
sweetice / Deep-reinforcement-learning-with-pytorch
PyTorch implementation of DQN, AC, ACER, A2C, A3C, PG, DDPG, TRPO, PPO, SAC, TD3 and ....
policy-gradient pytorch actor-critic-algorithm alphago deep-reinforcement-learning a2c dqn sarsa ppo a3c resnet algorithm deep-learning reinforce actor-critic sac td3 trpo
Language:Python 3634
AI4Finance-Foundation / ElegantRL
Massively Parallel Deep Reinforcement Learning. 🔥
pytorch reinforcement-learning ppo sac td3 dqn ddpg stable lightweight efficient model-free-rl drl-pytorch gae bipedalwalkerhardcore per multiple-gpu a2c
Language:Python 3476
ShangtongZhang / DeepRL
Modularized Implementation of Deep RL Algorithms in PyTorch
a2c categorical-dqn ddpg deep-reinforcement-learning deeprl double-dqn dqn dueling-network-architecture option-critic option-critic-architecture ppo prioritized-experience-replay pytorch quantile-regression rainbow td3
Language:Python 3115
XinJingHao / Deep-Reinforcement-Learning-Algorithms-with-Pytorch
Clean, Robust, and Unified PyTorch implementation of popular DRL Algorithms (Q-learning, Duel DDQN, PER, C51, Noisy DQN, PPO, DDPG, TD3, SAC, ASL)
deep-reinforcement-learning pytorch reinforcement-learning machine-learning asl c51 categorical-dqn ddpg double-dqn dueling-dqn noisynet-dqn ppo prioritized-experience-replay q-learning sac td3
Language:Python 773
Rafael1s / Deep-Reinforcement-Learning-Algorithms
32 projects in the framework of Deep Reinforcement Learning algorithms: Q-learning, DQN, PPO, DDPG, TD3, SAC, A2C and others. Each project is provided with a detailed training log.
deep-rl-algorithms github-udacity dqn-ppo-ddpg dqn td3 cartpole bipedalwalker deep-reinforcement-learning sac carracing hopperbulletenv lunarlander ddpg ppo a2c antbulletenv soft-actor-critic halfcheetahbulletenv walker2dbulletenv
Language:Jupyter Notebook 610
dongminlee94 / deep_rl
PyTorch implementation of deep reinforcement learning algorithms
a2c ddpg ddqn deep-reinforcement-learning dqn model-free-rl npg ppo pytorch sac sac-aea td3 trpo vpg
Language:Python 485
DRL-robot-navigation
reiniscimurs / DRL-robot-navigation
Deep Reinforcement Learning for mobile robot navigation in ROS Gazebo simulator. Using Twin Delayed Deep Deterministic Policy Gradient (TD3) neural network, a robot learns to navigate to a random goal point in a simulated environment while avoiding obstacles.
deep-reinforcement-learning deep-learning robot-navigation td3 ros gazebo obstacle-avoidance obstacle-avoidance-robot reinforcement-learning
Language:Python 447
machin
iffiX / machin
Reinforcement learning library(framework) designed for PyTorch, implements DQN, DDPG, A2C, PPO, SAC, MADDPG, A3C, APEX, IMPALA ...
reinforcement-learning deep-learning pytorch pytorch-reinforcement-learning dqn ddpg sac ppo td3 prioritized-experience-replay distributed a3c-pytorch python pytorch-lightning
Language:Python 389
zuoxingdong / lagom
lagom: A PyTorch infrastructure for rapid prototyping of reinforcement learning algorithms.
reinforcement-learning pytorch machine-learning python research deep-learning artificial-intelligence policy-gradient evolution-strategies deep-reinforcement-learning deep-deterministic-policy-gradient ddpg td3 soft-actor-critic mujoco proximal-policy-optimization ppo cem cmaes sac
Language:Jupyter Notebook 373
Arg0s1080 / mrz
Machine Readable Zone generator and checker for official travel documents sizes 1, 2, 3, MRVA and MRVB (Passports, Visas, national id cards and other travel documents)
mrz icao icao-codes travel-documents checker td1 td2 td3 visas mrva mrvb passport id-card transliteration
Language:Python 321
sudharsan13296 / Deep-Reinforcement-Learning-With-Python
Master classic RL, deep RL, distributional RL, inverse RL, and more using OpenAI Gym and TensorFlow with extensive Math
a2c a3c actor-critic bellman-equation c51 ddpg deep-learning deep-reinforcement-learning double-dqn dqn inverse-reinforcement-learning openai-gym policy-gradient ppo q-learning reinforcement-learning sac td3 trpo
Language:Jupyter Notebook 308
RITCHIEHuang / DeepRL_Algorithms
DeepRL algorithms implementation easy for understanding and reading with Pytorch and Tensorflow 2(DQN, REINFORCE, VPG, A2C, TRPO, PPO, DDPG, TD3, SAC)
reinforcement reinforcement-learning-algorithms pytorch-implementation deep-reinforcement-learning dqn policygradient ppo trpo mujoco policy-gradient tensorflow2 td3 pytorch-rl soft-actor-critic
Language:Python 307
twni2016 / pomdp-baselines
Simple (but often Strong) Baselines for POMDPs in PyTorch, ICML 2022
pomdp recurrent-neural-networks meta-rl robust-rl generalization deep-reinforcement-learning pytorch td3 sac discrete-sac credit-assignment
Language:Python 277
RchalYang / torchrl
Pytorch Implementation of Reinforcement Learning Algorithms ( Soft Actor Critic(SAC)/ DDPG / TD3 /DQN / A2C/ PPO / TRPO)
algorithm ddpg dqn gym mujoco policy-agent ppo pytorch reinforcement-learning rl-algorithms sac td3 trpo
Language:Python 197
sunghoonhong / AirsimDRL
Autonomous UAV Navigation without Collision using Visual Information in Airsim
reinforcement-learning airsim quadrotor depth-images ddpg td3 uav drone autonomous-quadcoptor
Language:Python 155
AgentMaker / Paddle-RLBooks
Paddle-RLBooks is a reinforcement learning code study guide based on pure PaddlePaddle.
policy-iteration value-iteration sarsa q-learning dqn nstep-dqn double-dqn dueling-dqn noisy-dqn c51 reinforce policy-gradient policy-gradient-with-baseline actor-critic ddpg td3 sac paddlepaddle reinforcement-learning
Language:Python 117
nikhilbarhate99 / TD3-PyTorch-BipedalWalker-v2
Twin Delayed DDPG (TD3) PyTorch solution for Roboschool and Box2d environment
ddpg td3 deep-reinforcement-learning openai-gym bipedalwalker pytorch pytorch-implmention reinforcement-learning openai-gym-environments lunar-lander
Language:Python 101
cyoon1729 / Policy-Gradient-Methods
Implementation of Algorithms from the Policy Gradient Family. Currently includes: A2C, A3C, DDPG, TD3, SAC
reinforcement-learning policy-gradients pytorch-rl pytorch ddpg td3 soft-actor-critic a2c a3c
Language:Jupyter Notebook 87
LxzGordon / Deep-Reinforcement-Learning-with-pytorch
Basic reinforcement learning algorithms. Including:DQN,Double DQN, Dueling DQN, SARSA, REINFORCE, baseline-REINFORCE, Actor-Critic,DDPG,DDPG for discrete action space, A2C, A3C, TD3, SAC, TRPO
pytorch algorithm reinforcement-learning dqn ddpg actor-critic policy-gradients a2c a3c sac td3 double-dqn dueling-dqn sarsa trpo
Language:Python 82
rlqp
BerkeleyAutomation / rlqp
Accelerating Quadratic Optimization with Reinforcement Learning
quadratic-programming osqp reinforcement-learning td3 admm-algorithm
80
ZYunfeii / DRL_algorithm_library
This is a reinforcement learning algorithm library. The code takes into account both performance and simplicity, with little dependence.
deep-reinforcement-learning ddpg maddpg ppo2 gae td3 sac pytorch-implementation drl
Language:Python 78
henry-prior / jax-rl
JAX implementations of core Deep RL algorithms
jax td3 reinforcement-learning deep-learning actor-critic deep-reinforcement-learning mujoco sac soft-actor-critic maximum-a-posteriori-estimation deepmind flax mpo
Language:Python 77
JohannesAck / MATD3implementation
Code for the RL method MATD3 described in the paper "Reducing Overestimation Bias in Multi-Agent Domains Using Double Centralized Critics"
reinforcement-learning multiagent-reinforcement-learning maddpg td3 rl
Language:Python 62
xlnwel / model-free-algorithms
TD3, SAC, IQN, Rainbow, PPO, Ape-X and etc. in TF1.x
reinforcement-learning model-free-rl ddpg sac td3 rainbow ppo
Language:Python 59
JuliaReinforcementLearning / ReinforcementLearningZoo.jl
iqn ddpg ppo julia reinforcement-learning dqn julia-language c51 rainbow a2c td3 cfr counterfactual-regret-minimization machine-learning sac hacktoberfest
Language:Julia 51
Barry2333 / DRL_Navigation
Robot navigation using deep reinforcement learning
attention-mechanism drl-pytorch gru navigation td3
Language:Python 38
CUN-bjy / rl-paper-review
road-map & paper review for Reinforcement Learning
policy-gradient rl reinforcement-learning paper-review ddpg ppo gae trpo td3 sac per her roadmap rl-roadmap review-page rl-review
38
kngwyu / Rainy
:umbrella: Deep RL agents with PyTorch:umbrella:
pytorch reinforcement-learning deep-reinforcement-learning dqn a2c acktr ppo td3 ddpg sac option-critic
Language:Python 37
deligentfool / policy_based_RL
The implement of the policy gradient RL algorithm with pytorch
reinforce actor-critic a2c trpo ppo ddpg td3 sac pytorch acer a3c icm rnd
Language:Python 35
chaovven / PyRL
PyRL - Reinforcement Learning Framework in Pytorch (Policy Gradient, DQN, DDPG, TD3, PPO, SAC, etc.)
pytorch dqn ddpg td3 reinforcement-learning deep-reinforcement-learning ppo soft-actor-critic
Language:Python 33
LQNew / Continuous_Control_Benchmark
Benchmark data (i.e., DeepMind Control Suite and MuJoCo) for RL.
mujoco dmc continuous-control benchmark-data reinforcement-learning td3 ddpg sac ppo
Language:Python 26
ZhengXinyue / Deep-rl-mxnet
Mxnet implementation of Deep Reinforcement Learning papers, such as DQN, PG, DDPG, PPO
reinforcement-learning-algorithms mxnet deep-reinforcement-learning dqn ddpg a2c policy-gradient td3
Language:Python 26
KarlXing / RLCodebase
RLCodebase: PyTorch Codebase For Deep Reinforcement Learning Algorithms
a2c atari codebase ddpg dqn mujoco ppo prioritized-experience-replay procgen pybullet pytorch reinforcement-learning reinforcement-learning-algorithms sac td3
Language:Python 24
Jason-CKY / DeepRL-pytorch
Pytorch implementations of various Deep Reinforcement Learning algorithms on pybullet environments.
pybullet-environments python3 reinforcement-learning-algorithms ddpg td3 trpo ppo pytorch-implementation rlbench
Language:Python 22

td3

datawhalechina / easy-rl

thu-ml / tianshou

sweetice / Deep-reinforcement-learning-with-pytorch

AI4Finance-Foundation / ElegantRL

ShangtongZhang / DeepRL

XinJingHao / Deep-Reinforcement-Learning-Algorithms-with-Pytorch

Rafael1s / Deep-Reinforcement-Learning-Algorithms

dongminlee94 / deep_rl

reiniscimurs / DRL-robot-navigation

iffiX / machin

zuoxingdong / lagom

Arg0s1080 / mrz

sudharsan13296 / Deep-Reinforcement-Learning-With-Python

RITCHIEHuang / DeepRL_Algorithms

twni2016 / pomdp-baselines

RchalYang / torchrl

sunghoonhong / AirsimDRL

AgentMaker / Paddle-RLBooks

nikhilbarhate99 / TD3-PyTorch-BipedalWalker-v2

cyoon1729 / Policy-Gradient-Methods

LxzGordon / Deep-Reinforcement-Learning-with-pytorch

BerkeleyAutomation / rlqp

ZYunfeii / DRL_algorithm_library

henry-prior / jax-rl

JohannesAck / MATD3implementation

xlnwel / model-free-algorithms

JuliaReinforcementLearning / ReinforcementLearningZoo.jl

Barry2333 / DRL_Navigation

CUN-bjy / rl-paper-review

kngwyu / Rainy

deligentfool / policy_based_RL

chaovven / PyRL

LQNew / Continuous_Control_Benchmark

ZhengXinyue / Deep-rl-mxnet

KarlXing / RLCodebase

Jason-CKY / DeepRL-pytorch