2019-01-17から1日間の記事一覧

2019-01-17

封建的階層型の強化学習の論文を読んでみる

強化学習

上位レベルはoption（サブゴールへの方策)を使った戦略、下位レベルはサブゴールまでを最適に行動する。この様に上位下達の封建的な分業関係を使った強化学習の論文(以下FuNs)を読んでみる。 [1703.01161] FeUdal Networks for Hierarchical Reinforcement L…