khhandrea / python-RL-SAC

(todo environment) Reinforcement learning soft actor critic method

python-RL-SAC

Reinforcement learning soft actor critic algorithm tutorial

Todo

v argparser
v Network는 SAC 안에서 정의
v refactoring
v sac agent select_action
v SAC에 save, load 추가
v SAC가 agent를 상속
v 함수, 변수에 private (prefix '__') 구현
v actions, states -> action, state 통일
v SAC에서 hyperparameter로 된 부분 main으로 빼기 (mlp의 SIG 등)
v typing 엄격하게
v import 정리
save 이름 format
코드 이쁘게
reward 그래프
checkpoint
PolicyMLP에 prefix '__' 못 바꿨음!
hyperparameter yml로?
docs 만들기
try catch 어떻게?
package와 __init__ 만들기
docker 세팅
우분투 세팅

About

(todo environment) Reinforcement learning soft actor critic method

Languages

Language:Python 100.0%