liuqi8827

PyTorch0.4 implementation of: actor critic / proximal policy optimization / acer / ddpg / twin dueling ddpg / soft actor critic / generative adversarial imitation learning / hindsight experience replay

000

FrameRecorder

Imagine you are drawing pictures or writing a program on your computer. Wouldn't you like to shoot small clips of your work while doing this? That's when Frame Recorder comes to your aid. It will save it for you! See hours of process in just a few minutes!

MIT000

tinyrl

Animated interactive visualization of Value-Iteration and Q-Learning in a Stochastic GridWorld environment.

000

reinforcement-learning-an-introduction

Python Implementation of Reinforcement Learning: An Introduction

MIT000

CLsurvey

Continual Hyperparameter Selection Framework. Compares 11 state-of-the-art Lifelong Learning methods and 4 baselines. Official Codebase of "A continual learning survey: Defying forgetting in classification tasks." in IEEE TPAMI.

NOASSERTION000

rl_openai

RL with OpenAI Gym

MIT000

MaplessNavigation

reinforcement learning algorithm for mapless navigation

000

spinning-up-basic

Basic versions of agents from Spinning Up in Deep RL written in PyTorch

MIT000

normalization_correlation

Estudo da normalização para o cálculo da correlação (pearson, spearman)

000

Save-my-Cat

Small game with Python Tkinter

000

leetcode_101

LeetCode 101：和你一起你轻松刷题（C++）

000

rad_openaigym

RAD: Reinforcement Learning with Augmented Data (code for state augmentation)

000

rad

RAD: Reinforcement Learning with Augmented Data

000

3DObjectTracking

Official Code: A Sparse Gaussian Approach to Region-Based 6DoF Object Tracking

MIT000

implementation-matters

MIT000

resume

个人中文简历 Latex 源码 https://hijiangtao.github.io/

MIT000

continuous-transition

ICRA 2021

000

smarties

Lightweight and scalable framework for Reinforcement Learning

MIT000

PyTorch-RL

PyTorch implementation of Deep Reinforcement Learning: Policy Gradient methods (TRPO, PPO, A2C) and Generative Adversarial Imitation Learning (GAIL). Fast Fisher vector product TRPO.

MIT000

Rainbow

Rainbow: Combining Improvements in Deep Reinforcement Learning

MIT000

ivideo

一个可以观看国内主流视频平台所有视频的客户端（Mac、Windows、Linux） A client that can watch video of domestic(China) mainstream video platform

MIT000

OpenAIGym

Solving OpenAI Gym problems.

000

robogym

Robotics Gym Environments

MIT000

liuqi8827

seven8827's repositories

atari-representation-learning

gym-sokoban

MountainCar-v0_DeepRL

SGI

Super-mario-bros-PPO-pytorch

autonomous_exploration_development_environment

snn-binary-sample-main

RL-Adventure-2

FrameRecorder

tinyrl

reinforcement-learning-an-introduction

CLsurvey

rl_openai

MaplessNavigation

spinning-up-basic

normalization_correlation

Save-my-Cat

leetcode_101

rad_openaigym

rad

3DObjectTracking

implementation-matters

resume

continuous-transition

smarties

PyTorch-RL

Rainbow

ivideo

OpenAIGym

robogym