画像認識

深層ベイズモデルによる長期予測での強化学習の論文を読む

深層ベイズ(深層生成)モデルは複雑な事象の変化が背後に潜在変数の変動によるものと仮定し、深層ネットワークで最適な潜在変数の変動を解くものである。この論文は潜在変数の変動をデコードして事象を再現し、これを長期予測として強化学習に適用したもの…

DeepMindの2D画像から3D動画を生成するGQNの論文を読んでみる

GQNは下図の様に隠れた物体が写っている2Dの画面を様々な方向から見た3D画像にして評判になっているが、これは現象から実体(3Dでの位置)を掴むベイズ式をうまく実用化しているからである。 まさしくプラトンのイデア論[1]を実現した画期的な試みである。画…

画像から実体の推移を予測して学習する論文を読んでみる

プラトンのイデア論では「本当にこの世に実在するのはイデアであって、我々が肉体的に感覚している対象や世界とはあくまでイデアの《似像》にすぎない」[1]としている。例えば3D迷路の場合、迷路内の自己位置が実体で、壁に囲まれた通路の視野が似像(画像)と…

言語解析で使うAttention型の深層学習がメタ学習を示す論文を読む

この論文は汎用翻訳モデルBertで使われるAttentionを使ったRNN型構造の深層学習が問題の構造に依らずメタ学習ができ、高次元のパターン認識や強化学習でも驚異的な性能を示したとするICRL2018報告である。 [1707.03141] A Simple Neural Attentive Meta-Lear…

VAEによる半教師学習の論文を再読する

(1) VAEによる半教師学習の論文を再読する [1406.5298] Semi-Supervised Learning with Deep Generative Models T研のMゼミでの発表でこの論文を再読する。 再度して判明したことは ・変分限界の式以外は殆ど理解していなかった ・この論文は省略が多く難し…

エネルギー関数によるGANの論文を再読する

ランニングできず 英語できず (1) Bengioエネルギー関数によるGANの論文を再読する 「Deep Directed Generative Models with Energy-Based Probability Estimation」https://arxiv.org/abs/1606.03439 逆強化学習で最も一般的なエネルギーベースモデルが理解…

画像から原因と結果を識別する論文を読む

(1) 画像から原因と結果を識別する論文を読む 「Discovering Causal signals in Images」https://arxiv.org/abs/1605.08179 これもhttps://twitter.com/miyamotok0105さん主催の「酒を飲みながらCVPR2017の論文を読む会」で興味を持った一つです。 この論文…

交通事故が起こる危険な場面の画像生成の論文を読む

ランニング30分 英語できず (1) 交通事故が起こる危険な場面の画像生成の論文を読む 「Expecting the Unexpected:Training Detectors for Unusual Pedestrians with Adeversarial Imposers」 https://scirate.com/arxiv/1703.06283 この論文は歩行者の危険な…

3D動画よりDoll House画像を生成する論文を読む

ランニング30分 英語できず (1) 3D動画よりDoll House画像を生成する論文を読む 「MatterPort3D: Learning from RGB-D Data in Indoor Environments」 https://arxiv.org/abs/1709.06158 この論文は屋内をMatterPort3Dと云う動画で撮ると、深層学習により屋…

深層生成による暗黒物質探査の論文を読む

テニス2時間 英語できず (1)深層生成による暗黒物質探査の論文を読む 「Enabling Dark Energy Science of with Deep Generative Models of Galaxy Images」 https://arxiv.org/abs/1609.05796 宇宙の80%を占めると云われている暗黒物質は宇宙膨張の謎を解…

領域識別による写真の色調転移の論文を読む

ランニングできず 英語できず (1) 領域識別による写真の色調転移の論文を読む 「Deep Photo Style Transfer」https://arxiv.org/abs/1703.07511 この論文も大変綺麗な写真が多数表示されていて有名なものです。この論文は情景が異なる入力と参照の2写真があ…

敵対的VAEの論文を読む

ランニングできず 英語できず (1)敵対的VAEの論文を読む 「Adversarial Autoencodes」https://arxiv.org/abs/1511.05644 前のCyclicに画像を学習するモデルでは敵対的VAEを使っていたので、その論文を読みました。 様々な癖がある手書き文字が数種類ある場合…

画像の転移学習を繰返し訓練する論文を読む

ランニングできず 英語できず (1) 画像の転移学習を繰返し訓練する論文を読む 「Unpaired Image-to-Image Translation using Cycle-Consistent Adversalial Networks」https://arxiv.org/abs/1703.10593 この論文は本年初頭に発表され、かなり綺麗な画像が生…

 混合分布を隠れ変数とするVAEの論文を読む

ランニングできず 英語できず (1) 混合分布を隠れ変数とするVAEの論文を読む 「VAE with a VampPrior」[1705.07120v3] VAE with a VampPrior KingmaのVAE(Variational Auto encoder)は深層学習に始めて生成モデルを導入した画期的な業績となっています。従来…

ダーウィン進化論を使った深層学習の最適化の論文を読む

ランニング30分 英語できず (1)ダーウィン進化論を使った深層学習の最適化の論文を読む 「Deep Learning with Darwin: Evolutionary Synthesis of Deep Neural Networks」 https://arxiv.org/abs/1606.04393v3 このモデルはダーウィンの進化論の発想から深層…

物体の2Dイメージを階層的に3Dにする論文を読む

ランニング30分 英語できず (1) 物体の2Dイメージを階層的に3Dにする論文を読む 「Hierarchical Surface Prediction for 3D Object Reconstruction」 https://arxiv.org/abs/1704.00710 この論文は2Dイメージに立方体を当てはめて境界をCNNで認識させて3…