jianzhnie / RLZero

A clean and easy implementation of MuZero, AlphaZero and Self-Play reinforcement learning algorithms for any game.

alpha-zero mcts multi-agent muzero reinforcement-learning self-play

RLZero

A clean and easy implementation of MuZero, AlphaZero and Self-Play reinforcement learning algorithms for any game.

References

Unified Toolkits

MCTS

https://github.com/masouduut94/MCTS-agent-python

AlpahZero

MuZero

DouZero

https://github.com/kwai/DouZero.git

Blog

MCTS 的前沿动态

如何追踪 MCTS 的前沿动态？（1）如何追踪 MCTS 的前沿动态？（2）如何追踪 MCTS 的前沿动态？（3）如何追踪 MCTS 的前沿动态？（4）

MCTS + RL 系列技术博客（1）：AlphaZero MCTS + RL 系列技术博客（2）：MuZero MCTS + RL 系列技术博客（3）：Sampled MuZero MCTS + RL 系列技术博客（4）：EfficientZero MCTS + RL 系列技术博客（5）：Stochastic MuZero MCTS + RL 系列技术博客（6）：浅析 MCTS 算法原理演进史

About

A clean and easy implementation of MuZero, AlphaZero and Self-Play reinforcement learning algorithms for any game.

alpha-zero mcts multi-agent muzero reinforcement-learning self-play

Apache License 2.0

Languages

Language:Python 100.0%