fedorajzf / IntrinsicallyEfficientStableOPE

IntrinsicallyEfficientStableOPE

Code for Intrinsically Efficient, Stable, and Bounded Off-Policy Evaluation for Reinforcement Learning

CB OPE (Tables 2--4)

Run

seq 4 | xargs -L 1 -P 4 ./script2.sh

in the appropriate folder.

RL OPE (Tables 5--7)

Run

windy.py
cliff.py
mountain.py

About

Languages

Language:Scilab 75.1%Language:Python 24.7%Language:Shell 0.2%