2017-08-27から1日間の記事一覧

2017-08-27

深層密度予測による擬似回数を報酬とした探索の論文を読む

ランニング30分英語：Toeic 深層密度予測による擬似回数を報酬とした探索の論文を読む [1703.01310] Count-Based Exploration with Neural Density Models End-to-End（RealTimeで学習しながら問題を解く）のDQNは衝撃を与えたが、解けないゲームが多数ある…