2017-07-24から1日間の記事一覧

2017-07-24

DeepMindの行動選択の論文を纏める

テニス２時間英語30分 Toeic (1) DeepMindの行動選択に模擬の選択を入れた論文「learning model-based plannning from scratch」を一応読了する。この模擬モデルは既にAlpha碁のRLモデルで早碁モデルとして採用されていたので、今さらと思えるが、不確定な…