htdt / ppo

Proximal Policy Optimization

Start

pip install -r requirements.txt
tensorboard --logdir runs
python -m train cartpole

git clone https://github.com/openai/baselines.git
pip install -e baselines

Proximal Policy Optimization

MIT License

Language:Python 100.0%