[GoalEnv] implementacja rewardu
jettjaniak opened this issue · comments
Nagroda jest gęsta. W każdym kroku jest to stała za przeżycie plus ograniczona nieujemna wartość za bycie w pobliżu punktu docelowego. ( - stała * norma_akcji jako penalty za nie-ekonomicznosc)