Distribution MADDPG using SEED_RL paradigm
- 加速
- 使用zmq
server/client
(并没有实现seed rl的设计stream gRPC),zmq方式 已经加速度比较明显 - TODO: stream gRPC batch inference + recurrent states 实现stream效果
- 使用zmq
- 随机过程:
-
tensorflow uniform
是目前simple
使用的随机过程 - ou(OrnsteinUhlenbeckProcess): TODO
- GaussianProcess(原:DiagGaussianPdType, Box 连续空间): TODO
- SoftCategoricas(原:SoftCategoricalPdType, Discrete离散空间): TODO
- SoftMultiCategorical(原:SoftMultiCategoricalPdType, MultiDiscrete连续空间): TODO
- Bernoulli(原:BernoulliPdType, 多二值变量连续空间): TODO
-
- 安装 `make install`
- 单元测试 `make test`
- 场景测试simple: `make run num_agent=3`
- Known dependencies: Python 3, OpenAI gym (0.10.5), tensorflow (2.3.0)
- 安装Multi-Agent Particle Environments (MPE)
- To install,
cd
into the root directory and typepip install -e .
- 核心算法实现:
maddpg.agents.maddpg.agent
,maddpg.agents.maddpg.base
- NN tf2实现:
maddpg.nets.actor
,maddpg.nets.critic
,maddpg.nets.mpl
- 运行进程
- 探索进程:
maddpg.explorer
- 学习进程:
maddpg.learner
- 参数设置:
maddpg.arguments
- 运行入口:
maddpg.run
- 公共模块: 环境,常数,日志,云存储等,
maddpg.common.*
- 探索进程:
- 其他:
zmq:
experiments.zmq
, zmq server/client模式回归测试