2018-03-01から1ヶ月間の記事一覧

actor-criticの実装よりアルゴリズム逆読み

強化学習の勉強会でゲーム学習の高速化の解説があった。強化学習の分散アーキテクチャ変遷 from 英爾関谷 www.slideshare.net これらはActor-criticを基本とした並列化、GPUの使用で高速化を図っている。ここでActor-criticのアルゴリズムを詳しく見てみ…

ロボテックス AI論文

人間本来が持つ好奇心は未知なものへのリスクやストレスに勝つていたので様々な発展と開拓があったのは間違いはない。強化学習の分野でも好奇心による改善はいくつか示されている。 mabonki0725.hatenablog.com Abbeel達は次の論文で、好奇心を情報量の改善…