協調型の強化学習の論文を読む

ランニングできず 英語できず

(1) マルチエージェントの強化学習モデルの論文を読む。この動画はこのモデルでの対戦模様である。

https://arxiv.org/abs/1703.10069

このモデルは双方向RNNであるBiCN(BiDirectionally Coordinated Network)が2つで構成されている。2モデル構成はポリシィ(戦略)学習とQ学習のモデルである。Agentが2モデルともRNN内で連結される事によって学習が伝播して自然な協調が達成できたとしている。しかし各Agentがどの様な特徴量で学習しているかは記述が無い。

GitHubこち

GitHub - eishub/Starcraft: This project creates a bridge between BWAPI for StarCraft: Brood War and EIS-enabled Multi-Agent Systems like GOAL.

ww

f:id:mabonki0725:20170617074333p:plain

w.youtube.com