2018-03-01から1ヶ月間の記事一覧

actor-criticの実装よりアルゴリズム逆読み

強化学習の勉強会でゲーム学習の高速化の解説があった。 強化学習の分散アーキテクチャ変遷 from 英爾 関谷 www.slideshare.net これらはActor-criticを基本とした並列化、GPUの使用で高速化を 図っている。ここでActor-criticのアルゴリズムを詳しく見てみ…

好奇心による強化学習の改善の理論化とその実証の論文を読む

人間本来が持つ好奇心は未知なものへのリスクやストレスに勝つていたので様々な発展と開拓があったのは間違いはない。強化学習の分野でも好奇心による改善はいくつか示されている。 mabonki0725.hatenablog.com Abbeel達は次の論文で、好奇心を情報量の改善…