深層生成モデルを使った強化学習が発表されており、この安定化のためZ-Forcingなるモデルを使っていたので、この論文を読んでみる。 深層ベイズモデルによる長期予測での強化学習の論文を読む - mabonki0725の日記 VAEを発展させ再帰深層学習(LSTM)にも潜在…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。