offline-reinforcement-learning

There are 4 repositories under offline-reinforcement-learning topic.

tinkoff-ai / CORL
High-quality single-file implementations of SOTA Offline and Offline-to-Online RL algorithms: AWAC, BC, CQL, DT, EDAC, IQL, SAC-N, TD3+BC, LB-SAC, SPOT, Cal-QL, ReBRAC
d4rl gym offline-reinforcement-learning reinforcement-learning
Language:Python 981
ikostrikov / jaxrl
JAX (Flax) implementation of algorithms for Deep Reinforcement Learning with continuous action spaces.
deep-learning deep-reinforcement-learning continuous-control reinforcement-learning soft-actor-critic sac deep-deterministic-policy-gradient jax flax gym behavioral-cloning offline-reinforcement-learning batch-reinforcement-learning
Language:Jupyter Notebook 584
Cryolite / kanachan
A Japanese (Riichi) Mahjong AI Framework
mahjong japanese-mahjong riichi-mahjong majsoul mahjong-soul machine-learning game-ai mahjong-ai reinforcement-learning deep-learning deep-reinforcement-learning transformers transformer imitation-learning behavioral-cloning offline-reinforcement-learning dqn curriculum-learning offline-rl
Language:Python 259
Allenpandas / Reinforcement-Learning-Papers
📚 List of Top-tier Conference Papers on Reinforcement Learning (RL)，including: NeurIPS, ICML, AAAI, IJCAI, AAMAS, ICLR, ICRA, etc.
deep-reinforcement-learning reinforcement-learning dqn imitation-learning multi-agent-reinforcement-learning policy-gradient q-learning artificial-intelligence reinforcement-learning-papers reinforcement-learning-conferences rl-papers aaai icml ijcai reinforcement-learning-conferences-papers reinforcement-learning-paper neurips hierarchical-reinforcement-learning meta-reinforcement-learning offline-reinforcement-learning
248
yihaosun1124 / OfflineRL-Kit
An elegant PyTorch offline reinforcement learning library for researchers.
deep-learning deep-reinforcement-learning offlinerl pytorch reinforcement-learning offline-reinforcement-learning
Language:Python 238
nikhilbarhate99 / min-decision-transformer
Minimal implementation of Decision Transformer: Reinforcement Learning via Sequence Modeling in PyTorch for mujoco control tasks in OpenAI gym
reinforcement-learning deep-reinforcement-learning deep-learning offline-reinforcement-learning pytorch pytorch-transformers transformer machine-learning openai-gym mujoco robotics
Language:Python 227
polixir / OfflineRL
A collection of offline reinforcement learning algorithms.
offline-reinforcement-learning reinforcement-learning
Language:Python 139
BY571 / CQL
PyTorch implementation of the Offline Reinforcement Learning algorithm CQL. Includes the versions DQN-CQL and SAC-CQL for discrete and continuous action spaces.
reinforcement-learning-algorithms offline-reinforcement-learning dqn sac pytorch-implementation discrete-sac pytorch machine-learning
Language:Python 103
polixir / NeoRL
Python interface for accessing the near real-world offline reinforcement learning (NeoRL) benchmark datasets
offline-reinforcement-learning
Language:Python 97
instadeepai / og-marl
:battery: Datasets with baselines for offline multi-agent reinforcement learning.
multi-agent-reinforcement-learning reinforcement-learning offline-reinforcement-learning
Language:Python 90
ZhengyaoJiang / latentplan
Code release for Efficient Planning in a Compact Latent Action Space (ICLR2023) https://arxiv.org/abs/2208.10291.
model-based-reinforcement-learning offline-reinforcement-learning reinforcement-learning generative-model transformer
Language:Python 86
snu-mllab / EDAC
Official PyTorch implementation of "Uncertainty-Based Offline Reinforcement Learning with Diversified Q-Ensemble" (NeurIPS'21)
offline-reinforcement-learning
Language:Python 68
ryanxhr / POR
[NeurIPS 2022 Oral] The official implementation of POR in "A Policy-Guided Imitation Approach for Offline Reinforcement Learning"
offline-reinforcement-learning pytorch
Language:Python 53
tinkoff-ai / ReBRAC
Author's implementation of ReBRAC, a minimalist improvement upon TD3+BC
offline-reinforcement-learning reinforcement-learning
Language:Jupyter Notebook 50
LanqingLi1993 / FOCAL-ICLR
Code for FOCAL Paper Published at ICLR 2021
offline-reinforcement-learning meta-learning distance-metric-learning meta-rl multi-task-learning reinforcement-learning
Language:Python 47
tinkoff-ai / sac-rnd
Official implementation for "Anti-Exploration by Random Network Distillation", ICML 2023
offline-reinforcement-learning random-network-distillation flax-implementation deep-reinforcement-learning jax-implementation
Language:Python 47
DHDev0 / Stochastic-muzero
Pytorch Implementation of Stochastic MuZero for gym environment. This algorithm is capable of supporting a wide range of action and observation spaces, including both discrete and continuous variations.
arxiv-papers machine-learning offline-reinforcement-learning online-reinforcement-learning muzero-stochastic stochastic-muzero deep-reinforcement-learning gym-environments lstm monte-carlo-tree-search muzero pytorch resnetv2 rl transformer multilayer-perceptron
Language:Python 44
ZhengYinan-AIR / FISOR
[ICLR 2024] The official implementation of "Safe Offline Reinforcement Learning with Feasibility-Guided Diffusion Model"
diffusion-models hamilton-jacobi-reachability jax offline-reinforcement-learning safe-reinforcement-learning imitation-learning reinforcement-learning
Language:Python 44
Howuhh / sac-n-jax
Single-file SAC-N implementation on jax with flax and equinox. 10x faster than pytorch
d4rl offline-reinforcement-learning reinforcement-learning flax jax equinox
Language:Python 43
snu-mllab / DPPO
Official implementation of "Direct Preference-based Policy Optimization without Reward Modeling" (NeurIPS 2023)
offline-reinforcement-learning reinforcement-learning rlhf preference-based-reinforcement-learning
Language:Python 32
ryanxhr / DWBC
[ICML 2022] The official implementation of DWBC in "Discriminator-Weighted Offline Imitation Learning from Suboptimal Demonstrations"
imitation-learning offline-reinforcement-learning pytorch
Language:Python 31
LoopMind-AI / loopquest
A Production Tool for Embodied AI
decision-making-algorithm foundation-model gym gym-environment mlops mlops-workflow reinforcement-learning rlops simulation reinforcement-learning-ops machine-learning offline-reinforcement-learning embodied-agent embodied-ai
Language:Python 27
YangRui2015 / AWGCSL
Code for ICLR 2022 paper Rethinking Goal-Conditioned Supervised Learning and Its Connection to Offline RL.
reinforcement-learning offline-reinforcement-learning hindsight-experience-replay
Language:Python 27
sail-sg / rosmo
Codes for "Efficient Offline Policy Optimization with a Learned Model", ICLR2023
atari model-based-rl muzero offline-reinforcement-learning reinforcement-learning rl-unplugged jax dm-haiku arcade-learning-environment bsuite model-based-reinforcement-learning muzero-unplugged offline-rl
Language:Python 26
kschweig / OfflineRL
Experiment for Understanding the Effects of Dataset Characteristics on Offline Reinforcement Learning
reinforcement-learning offline-reinforcement-learning dataset-generation
Language:Jupyter Notebook 23
ZhengYinan-AIR / OMIGA
[NeurIPS 2023] The official implementation of "Offline Multi-Agent Reinforcement Learning with Implicit Global-to-Local Value Regularization"
multi-agent-reinforcement-learning offline-reinforcement-learning pytorch mujoco reinforcement-learning
Language:Python 23
holarissun / RewardShifting
Code for NeurIPS 2022 paper Exploiting Reward Shifting in Value-Based Deep RL
ensemble exploration-exploitation offline-reinforcement-learning reinforcement-learning reward-design reward-engineering reward-shaping value-based-methods deep-q-network rnd dqn-rnd ensemble-learning ensemble-rl
Language:Python 22
xionghuichen / MAPLE
The Official Code for Offline Model-based Adaptable Policy Learning (NeurIPS'21 & TPAMI)
reinforcement-learning tensorflow offline-rl offline-reinforcement-learning paper
Language:Python 22
yudasong / HyQ
Official code repo for paper: Hybrid RL: Using both offline and online data can make RL efficient.
offline-reinforcement-learning q-learning reinforcement-learning reinforcement-learning-theory hybrid-reinforcement-learing
Language:Python 21
DesikRengarajan / FEDORA
[FL-ICML 2023] Code for Federated Ensemble-Directed Offline Reinforcement Learning
federated-learning federated-reinforcement-learning offline-reinforcement-learning pytorch reinforcement-learning federated-offline-reinforcement-learning
Language:Python 19
Mohan-Zhang-u / smpl
benchmarks bioinformatics biology chemistry control-theory datasets deep-learning environment manufacturing neurips reinforcement-learning offline-reinforcement-learning
Language:Jupyter Notebook 19
zaiyan-x / RFQI
Implementation of Robust Reinforcement Learning using Offline Data [NeurIPS'22]
offline-reinforcement-learning reinforcement-learning
Language:Python 19
tinkoff-ai / lb-sac
Official implementation for "Q-Ensemble for Offline RL: Don't Scale the Ensemble, Scale the Batch Size", NeurIPS 2022, Offline RL Workshop
offline-reinforcement-learning deep-reinforcement-learning ensemble-learning pytorch-implementation
Language:Python 18
ReinholdM / Papers-of-Offline-RL
Related papers for offline reforcement learning (we mainly focus on representation and sequence modeling and conventional offline RL)
offline-reinforcement-learning reinforcement-learning
17
YangRui2015 / RORL
Code for NeurIPS 2022 paper "Robust offline Reinforcement Learning via Conservative Smoothing"
offline-reinforcement-learning reinforcement-learning robust-reinforcement-learning
Language:Python 16
Manchery / iql-pytorch
Unofficial PyTorch implementation (replicating paper results) of Implicit Q-Learning (In-sample Q-Learning) for offline RL
implicit-q-learning offline-reinforcement-learning pytorch reinforcement-learning
Language:Python 15