複数エージェント間の均衡を図る強化学習の論文を読む

AI論文

年初に発表された複数エージェントでの協調や敵対学習で画期的な性能を示したAbbeel達のモデル(MADDPG)があり、これには動画やGitHubにソースが公開されているので、様々な改良を加えた研究の成果がこれから発表されると思われる。複数エージェントの協調学…

2018-11-22

位置関係を畳込で抽象化した複数エージェントの論文を読む

IBMの恐神先生の複数エージェントの講演で出会った知人から、この講演の様にマルチエージェントの動作を動画と捉えConvolutionして特徴抽出するモデルが注目されていると聞いたが、この論文も複数エージェントの動作を動態グラフと見做してConvolutionで特徴…

2018-11-15

共有知識での複数エージェントの強化学習の論文を読む

国際学会での発表の準備で忙しかったが、ようやく複数エージェントでの共通知識による強化学習(MACKRL)の論文を読んだ。 [1810.11702] Multi-Agent Common Knowledge Reinforcement Learning これは下図の様に相手が見えるＡとＢは、互いに密接に連絡し合う…

2018-11-01

相手への影響を報酬の一部とした協調強化学習の論文を読む

AI論文

エージェントの相互の影響を反映した社会的動機による協調強化学習と訳せばいいのか、次のタイトルの論文を読む。 [1810.08647v1] Intrinsic Social Motivation via Causal Influence in Multi-Agent RL 相手の行動と自分の内部状態を因果として次の行動を決…

mabonki0725の日記

2018-11-01から1ヶ月間の記事一覧

複数エージェント間の均衡を図る強化学習の論文を読む

位置関係を畳込で抽象化した複数エージェントの論文を読む

共有知識での複数エージェントの強化学習の論文を読む

相手への影響を報酬の一部とした協調強化学習の論文を読む