2018-08-08から1日間の記事一覧

2018-08-08

敵対的理論より学習環境に依存しない逆強化学習の論文を読む

AI論文

このバークレイ学派の論文の寄与は次の２点である [1710.11248] Learning Robust Rewards with Adversarial Inverse Reinforcement Learning ① 逆強化学習(IRL)はGANと同じ理論とする論文により IRLをGANの識別(Discriminator)関数の最適化で解く ②このモデ…