動画から系列型のVAE方式による状態推移を予測する強化学習として、優秀な学習効率を達成したモデルの論文である。 [1811.04551] Learning Latent Dynamics for Planning from Pixels 系列型VAEの強化学習モデルWorld Modelを最初に発表したDavid Haも著者に…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。