2018-01-03から1日間の記事一覧

逆強化学習の深層学習版をC言語で実装してみた

年末にC言語でSGD（確率勾配法）で逆強化学習を実装したが、深層学習版でも実装してみました。 SGDと結果は殆ど変わりませんが、PRMLの５章にあるチューニング無しのロジックの深層学習なので相当時間がかかりました（約３分 SGD版の100倍）。示せたことはC…