iminders / maddpg

Distribution maddpg

maddpg

Distribution MADDPG using SEED_RL paradigm

参考

Features

快速开始

ubuntu/mac

- 安装 `make install`
- 单元测试 `make test`
- 场景测试simple: `make run num_agent=3`

源码安装

Known dependencies: Python 3, OpenAI gym (0.10.5), tensorflow (2.3.0)
安装Multi-Agent Particle Environments (MPE)
To install, cd into the root directory and type pip install -e .

设计TODO

关键代码说明

核心算法实现: maddpg.agents.maddpg.agent, maddpg.agents.maddpg.base
NN tf2实现: maddpg.nets.actor, maddpg.nets.critic, maddpg.nets.mpl
运行进程
- 探索进程: maddpg.explorer
- 学习进程: maddpg.learner
- 参数设置: maddpg.arguments
- 运行入口: maddpg.run
- 公共模块: 环境，常数，日志，云存储等, maddpg.common.*
其他: zmq: experiments.zmq, zmq server/client模式回归测试

实验

速度:
- 纯CPU环境
  - simple agent_num=3, 平均batch时间约为原版的1/3, 运行日志
  - simple agent_num=20, TODO
收敛:
- 纯CPU环境
  - simple agent_num=3, 比原版更优, 运行日志
  - simple agent_num=20, TODO

About

Distribution maddpg

MIT License

Languages

Language:Python 86.7%Language:Dockerfile 11.3%Language:Makefile 1.5%Language:Shell 0.5%