スマートフォン用の表示で見る

mabonki0725の日記

2017-12-15から1日間の記事一覧

2017-12-15

逆強化学習をC言語で実装してみた

確率・統計 ロボテックス

(1) 逆強化学習をC言語で実装してみた 計算機どうしが互いに強化するモデル(敵対モデル)を構成するには、単独での初期学習が充実していないと実現しないのは、アルファー碁やbonanzaの示す所と考えています。 そこで敵対モデルを一般的に拡張した場合での…

はてなブックマーク - 逆強化学習をC言語で実装してみた
逆強化学習をC言語で実装してみた
検索
リンク
  • padoc
  • github
  • slide Share
最新記事
  • DeepMindの2D画像から3D動画を生成するGQNの論文を読んでみる
  • 画像から実体の推移を予測して学習する論文を読んでみる
  • 砂のトラックを走行する実自動車での強化学習の論文を読む
  • メタ学習による実世界での変異や誤差に対応した学習の論文を読む
  • 言語解析で使うAttention型の深層学習がメタ学習を示す論文を読む
  • 封建的階層型の強化学習の論文を読んでみる
  • 相互情報量を使ったOptionを認識する論文を読んでみる
月別アーカイブ
mabonki0725の日記 mabonki0725の日記

Powered by Hatena Blog | ブログを報告する

スターをつけました

引用をストックしました

引用するにはまずログインしてください

引用をストックできませんでした。再度お試しください

限定公開記事のため引用できません。

読者です 読者をやめる 読者になる 読者になる