Distributed-MADDPG

Distributed Multi-Agent Cooperation Algorithm based on MADDPG with prioritized batch data.

Distributed Multi-Agent Architecture

Introduction

This work focus on Multi-Agent Cooperation Problem. We proposed a method which consists 3 components:

Related research - MADDPG This algorithm comes from Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments
Prioritized Batch Data To optimize one-step update without losing diversity, we divide batch data into several parts and prioritize these batches. Using the batch data with maximal loss to do one-step update.
Distributed Multi-Agent Architecture Similar to A3C algorithm, we adopt this Master and Multi-Worker architecture in our work.

Experiment

Implementation

Keras 2.1.2 （tensorflow 1.4 as backend）
mpi4py
Python 3.6
CUDA 8.0 + cuDNN 6.0

Environment

Modified original environment (you can find in my repo) from OpenAI
- Fixed landmark
- Border

Neural Network

Result

Learning Progress

DDPG & MADDPG & PROPOSED

How to run this program

For program using MPI:

mpiexec -np [worker_number] python mpi-xxx.py

mpiexec -np 4 python mpirun_main.py

For others:

python xxx.py

Name		Name	Last commit message	Last commit date
Latest commit History 66 Commits
__pycache__		__pycache__
dummy files		dummy files
imgs		imgs
multiagent-envs		multiagent-envs
tests		tests
.gitignore		.gitignore
Distributed_Train.py		Distributed_Train.py
ExplorationNoise.py		ExplorationNoise.py
LICENSE		LICENSE
README.md		README.md
ReplayMemory.py		ReplayMemory.py
Train.py		Train.py
Train_ddpg.py		Train_ddpg.py
Train_dis.py		Train_dis.py
Train_maddpg.py		Train_maddpg.py
Train_maddpg_prioritized.py		Train_maddpg_prioritized.py
actorcritic_dis.py		actorcritic_dis.py
main.py		main.py
main_ddpg.py		main_ddpg.py
main_dis.py		main_dis.py
main_maddpg.py		main_maddpg.py
main_maddpg_prioritized.py		main_maddpg_prioritized.py
main_maddpg_test.py		main_maddpg_test.py
mpirun_dis.py		mpirun_dis.py
mpirun_main.py		mpirun_main.py
mpirun_test.py		mpirun_test.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Distributed-MADDPG

Distributed Multi-Agent Architecture

Introduction

Experiment

Implementation

Environment

Neural Network

Result

Learning Progress

How to run this program

Future Work (4 vs 2)

Thanks to

About

Releases

Packages

Languages

License

namidairo777/Distributed-MADDPG

Folders and files

Latest commit

History

Repository files navigation

Distributed-MADDPG

Distributed Multi-Agent Architecture

Introduction

Experiment

Implementation

Environment

Neural Network

Result

Learning Progress

How to run this program

Future Work (4 vs 2)

Thanks to

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages