reinforcement-learning-kr / pg_travel

Policy Gradient algorithms (REINFORCE, NPG, TRPO, PPO)

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

경사가 있는 환경에서 에이전트 학습시키기

dnddnjs opened this issue · comments

학습은 기존 평평한 곳에서 학습시킨 PPO 에이전트를 베이스라인으로해서 학습
환경은 가능하다면 민규식님의 도움을 받아볼 것.
아래는 대충 나눈 거니까 두 분이서 의논하시면서 진행하시면 어떨까 싶습니다.
중간중간 이 이슈에 과정 남겨주세요!