2017-08-21から1日間の記事一覧

2017-08-21

MicroSoftのゲームのアイテム毎に強化学習する論文を読む

テニス２時間英語：できず (1) ゲームのアイテム毎に強化学習する論文を読む「Hybrid Reward Architecher for Reinforcement Learning」https://arxiv.org/abs/1706.04208 (1.1) 論文の意図 DQNは画面からDNNで直接特徴量を読み取り、特徴量の変化と得点で…