2017-10-13から1日間の記事一覧

2017-10-13

一般化報酬による高次元の強化学習の論文を読む

ランニングできず英語できず (1) 一般化報酬による高次元の強化学習の論文を読む「High - Dimensional Continuous Control using Generated Advantage Estimation」 https://arxiv.org/abs/1506.02438 ゲームの強化学習ではQ-learningが一般的ですが、人間…