yyf17

YinfengYu's repositories

ROMA

Codes accompanying the paper "ROMA: Multi-Agent Reinforcement Learning with Emergent Roles" (ICML 2020 https://arxiv.org/abs/2003.08039)

Language:PythonApache-2.0100

AI-QMIX

Code for "AI-QMIX: Attention and Imagination for Dynamic Multi-Agent Reinforcement Learning"

MIT000

CollaQ

A code implementation for our arXiv paper "Multi-agent Adhoc Team Play using Decompositional Q function"

Language:PythonNOASSERTION010

deeprl_signal_control

multi-agent deep reinforcement learning for large-scale traffic signal control.

MIT000

DOP

Codes accompanying the paper "DOP: Off-Policy Multi-Agent Decomposed Policy Gradients" (https://arxiv.org/abs/2007.12322)

Apache-2.0000

emix

Energy-based Surprise Minimization for Multi-Agent Value Factorization

Apache-2.0000

gitignore

A collection of useful .gitignore templates

CC0-1.0000

habitat-sim

A flexible, high-performance 3D simulator for Embodied AI research.

MIT000

ICLR2021-OpenReviewData

Crawl & visualize ICLR papers and reviews.

Language:Jupyter Notebook010

img2latex-mathpix

An image to LaTeX tool by MathpixOCR API and JavaFX

Apache-2.0000

jps

Code for "Joint Policy Search for Collaborative Multi-agent Incomplete Information Games"

NOASSERTION000

LICA

[NeurIPS 2020] PyTorch implementation of "Learning Implicit Credit Assignment for Cooperative Muti-Agent Reinforcement Learning"

MIT000

maddpg

Code for the MADDPG algorithm from the paper "Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments"

MIT000

MAVEN

Submission for MAVEN: Multi-Agent Variational Exploration

000

multiagent-particle-envs

Code for a multi-agent particle environment used in the paper "Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments"

MIT000

NDQ

Codes accompanying the paper "Learning Nearly Decomposable Value Functions with Communication Minimization" (ICLR 2020)

Apache-2.0000

RelationalGraphLearning

[IROS20] Relational graph learning for crowd navigation

000

Codes accompanying the paper "RODE: Learning Roles to Decompose Multi-Agent Tasks (https://arxiv.org/abs/2010.01523). RODE is a scalable role-based multi-agent learning method which effectively discovers roles based on joint action space decomposition according to action effects, establishing a new state of the art on the StarCraft multi-agent benchmark.

Apache-2.0000

Speech-Emotion-Recognition

Speech emotion recognition implemented in Keras (LSTM, CNN, SVM, MLP) | 语音情感识别

MIT000

wqmix

Code for Weighted QMIX

000

yyf17

YinfengYu's repositories

ROMA

AI-QMIX

ASN

avn

CollaQ

comix

dcg

deeprl_signal_control

DOP

emix

epciclr2020

gitignore

habitat-sim

ICLR2021-OpenReviewData

ICRA2020_manipulation

img2latex-mathpix

ImitationLearning

jps

LICA

maddpg

MAVEN

multiagent-particle-envs

NDQ

QDPP

QPLEX

raa-drl

RelationalGraphLearning

RODE

Speech-Emotion-Recognition

wqmix