2018-03-15から1日間の記事一覧

actor-criticの実装よりアルゴリズム逆読み

強化学習の勉強会でゲーム学習の高速化の解説があった。強化学習の分散アーキテクチャ変遷 from 英爾関谷 www.slideshare.net これらはActor-criticを基本とした並列化、GPUの使用で高速化を図っている。ここでActor-criticのアルゴリズムを詳しく見てみ…