有名な階層型強化学習の論文を読む

強化学習で階層型がよく話題になっているが、東大修士１年が勉強会で発表していたので興味を持ち読んでみた。 [1804.02808] Latent Space Policies for Hierarchical Reinforcement Learning バークレイの連中の論文で強化学習での階層間を深層学習と同様に…

2018-08-08

敵対的理論より学習環境に依存しない逆強化学習の論文を読む

AI論文

このバークレイ学派の論文の寄与は次の２点である [1710.11248] Learning Robust Rewards with Adversarial Inverse Reinforcement Learning ① 逆強化学習(IRL)はGANと同じ理論とする論文により IRLをGANの識別(Discriminator)関数の最適化で解く ②このモデ…

2018-08-05

複数エージェントの協調学習に成功している論文を読む

AI論文

この論文はデモが凄いので結構よく論文が読まれている。これはバークレイ学派 Abbeel達の発表である。 [1706.02275v3] Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments この４つのデモでは、複数のエージェントが協調や敵対を報酬…

2018-08-03

複雑な最終状態を認識して行動する強化学習の論文を読む

AI論文

論文の図１にある様な複雑な最終状態(goal)を認識してロボットがそれに到達するモデルである。著者はバークレイ学派の重鎮 Sergey Levine等である。 [1807.04742] Visual Reinforcement Learning with Imagined Goals 実際の動作の動画は下記。下が最終状態 …

2018-08-01

夢で学習する強化学習モデルの論文を読む

AI論文

この論文のタイトルは「world Model」で世界認識と訳せばよい分らないが、大げさなタイトルに適った素晴らしい内容である。 [1803.10122v4] World Models 著者は日本では有名なDavid Haであるが、著者の一人はLSTMの開発者の一人でシュミットフーバー等(Schm…

mabonki0725の日記

2018-08-01から1ヶ月間の記事一覧

有名な階層型強化学習の論文を読む

敵対的理論より学習環境に依存しない逆強化学習の論文を読む

複数エージェントの協調学習に成功している論文を読む

複雑な最終状態を認識して行動する強化学習の論文を読む

夢で学習する強化学習モデルの論文を読む