[GoalEnv] Nie uczy sie
dzako opened this issue · comments
GoalEnv sie nie uczy, powodem prawdopodobnie jest niepelny wektor obserwacji, brakuje informacji o przyspieszeniu lub lidarow mierzących odległość, statek dowiaduje sie ze jest za blisko planety dopiero po rozbiciu sie i terminacji epizodu. Pewnie reward jest tez zbyt sparse
spróbujmy odpalić eksperyment z jedną planetą
goal-env z 1 planeta, wyglada lepiej: https://app.neptune.ai/cyranka/space/e/SPAC-78/charts
Super. Zrobisz więcej eksperymentów z różną liczbą planet?
tak zaraz zapuszcze na rl'u
goal-env z 1 planetą 1mln frames
https://app.neptune.ai/cyranka/space/e/SPAC-80/charts
calkiem niezle wyglada,
no to teraz 2 planety