Reinforcement learning soft actor critic algorithm tutorial
-
v argparser
-
v Network는 SAC 안에서 정의
-
v refactoring
-
v sac agent select_action
-
v SAC에 save, load 추가
-
v SAC가 agent를 상속
-
v 함수, 변수에 private (prefix '__') 구현
-
v actions, states -> action, state 통일
-
v SAC에서 hyperparameter로 된 부분 main으로 빼기 (mlp의 SIG 등)
-
v typing 엄격하게
-
v import 정리
-
save 이름 format
-
코드 이쁘게
-
reward 그래프
-
checkpoint
-
PolicyMLP에 prefix '__' 못 바꿨음!
-
hyperparameter yml로?
-
docs 만들기
-
try catch 어떻게?
-
package와 __init__ 만들기
-
docker 세팅
-
우분투 세팅