uclaml / POWERS

Near-optimal Policy Optimization Algorithms for Learning Adversarial Linear Mixture MDPs

POWERS

Near-optimal Policy Optimization Algorithms for Learning Adversarial Linear Mixture MDPs

Near-optimal Policy Optimization Algorithms for Learning Adversarial Linear Mixture MDPs

Apache License 2.0

Language:Jupyter Notebook 82.5%Language:Python 17.5%