人間のコントロールで早期に学習する強化学習の論文を読む

AI論文

強化学習は学習に相当時間がかかる事が知られているが、人間が要所々にコントロールして教えれば学習が効果的にきるとの考えを実現した論文である。 [1709.10163] Deep TAMER: Interactive Agent Shaping in High-Dimensional State Spaces 本論文の手法はDe…

2018-10-21

DeepMindのチーム対戦の強化学習の論文を読む

AI論文

DeepMindの複数エージェントのチームでの勝敗による強化学習が人間のレベルを超えており、この理論と実験の詳細な報告になっている。 [1807.01281v1] Human-level performance in first-person multiplayer games with population-based deep reinforcement …

2018-10-15

他のエージェントとの協調特徴より複数エージェントの強化学習の論文を読む

この論文は他のエージェント間での協調特徴ベクトルでを深層学習のAttentionで摘出して、最適な協業をする複数エージェントの強化学習モデルである。 [1810.02912] Actor-Attention-Critic for Multi-Agent Reinforcement Learning 次の画期的な性能を示す中…

2018-10-07

視覚的な転移学習による強化学習の論文を読む

国際大会での発表の準備で疲弊しているが、「もくどく会」があったので途中まで読んでいたATARIゲームの転移学習による強化学習を読む [1809.00397v1] Visual Transfer between Atari Games using Competitive Reinforcement Learning この論文はATARIゲーム…

mabonki0725の日記

2018-10-01から1ヶ月間の記事一覧

人間のコントロールで早期に学習する強化学習の論文を読む

DeepMindのチーム対戦の強化学習の論文を読む

他のエージェントとの協調特徴より複数エージェントの強化学習の論文を読む

視覚的な転移学習による強化学習の論文を読む