2017-12-15から1日間の記事一覧

逆強化学習をC言語で実装してみた

(1) 逆強化学習をC言語で実装してみた計算機どうしが互いに強化するモデル（敵対モデル）を構成するには、単独での初期学習が充実していないと実現しないのは、アルファー碁やbonanzaの示す所と考えています。そこで敵対モデルを一般的に拡張した場合での…