khhandrea / python-RL-SAC

(todo environment) Reinforcement learning soft actor critic method

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

python-RL-SAC

Reinforcement learning soft actor critic algorithm tutorial

Todo

  • v argparser

  • v Network는 SAC 안에서 정의

  • v refactoring

  • v sac agent select_action

  • v SAC에 save, load 추가

  • v SAC가 agent를 상속

  • v 함수, 변수에 private (prefix '__') 구현

  • v actions, states -> action, state 통일

  • v SAC에서 hyperparameter로 된 부분 main으로 빼기 (mlp의 SIG 등)

  • v typing 엄격하게

  • v import 정리

  • save 이름 format

  • 코드 이쁘게

  • reward 그래프

  • checkpoint

  • PolicyMLP에 prefix '__' 못 바꿨음!

  • hyperparameter yml로?

  • docs 만들기

  • try catch 어떻게?

  • package와 __init__ 만들기

  • docker 세팅

  • 우분투 세팅

About

(todo environment) Reinforcement learning soft actor critic method


Languages

Language:Python 100.0%