2020-02-01から1ヶ月間の記事一覧

Atariゲームの予測画像(worldModel)上で方策改善が効率的であった論文を読んでみる

David HaがVAEで一旦抽象化して生成した擬似動画をWorldModelと称し、このWorldModelの擬似動画での訓練が実画面でも効果があった事を報告している。 夢で学習する強化学習モデルの論文を読む - mabonki0725の日記 今回読んだ論文は複数のAtariゲームでのWor…

動画の状態推移を予測する強化学習の論文を読んでみる

動画から系列型のVAE方式による状態推移を予測する強化学習として、優秀な学習効率を達成したモデルの論文である。 [1811.04551] Learning Latent Dynamics for Planning from Pixels 系列型VAEの強化学習モデルWorld Modelを最初に発表したDavid Haも著者に…

Z-Forcing 再帰深層学習に導入した潜在変数の適合を強いる論文を読む

深層生成モデルを使った強化学習が発表されており、この安定化のためZ-Forcingなるモデルを使っていたので、この論文を読んでみる。 深層ベイズモデルによる長期予測での強化学習の論文を読む - mabonki0725の日記 VAEを発展させ再帰深層学習(LSTM)にも潜在…

深層ベイズモデルによる長期予測での強化学習の論文を読む

深層ベイズ(深層生成)モデルは複雑な事象の変化が背後に潜在変数の変動によるものと仮定し、深層ネットワークで最適な潜在変数の変動を解くものである。この論文は潜在変数の変動をデコードして事象を再現し、これを長期予測として強化学習に適用したもの…

室内画面の生成する階層型VAEの論文を読む

系列環境での強化学習を考えるため、まず環境を生成するモデルとして下記を読んでみる。 この論文は室内画面を多数生成するモデルで階層型のVAEを使っている。 [1807.09193] GRAINS: Generative Recursive Autoencoders for INdoor Scenes 階層型のVAEはSoch…