深層生成による暗黒物質探査の論文を読む
テニス2時間 英語できず
(1)深層生成による暗黒物質探査の論文を読む
「Enabling Dark Energy Science of with Deep Generative Models of Galaxy Images」
https://arxiv.org/abs/1609.05796
宇宙の80%を占めると云われている暗黒物質は宇宙膨張の謎を解く鍵とされていますが、観測が難しいので実態が不明なままです。この実態は下図の黒い部分の様に銀河の光を通して間接的に観測します。具体的には重力レンズという理論で銀河の光の歪みを観測して暗黒物質の規模を推定しています。しかし銀河の光の歪みを計測することも難しいので、VAEやGANを使って銀河の画像を補正しようとする論文です。
(1.1) 手法
ここでは条件付VAEと条件付GANの2種類で銀河の画像を生成しています。
条件付VAEは良く似ていますが半教師学習のSemi-VAEではありません。
画像に一部のみラベルが付いている場合がSemi-VAEです。
データとしては8500個の銀河の画像(64×64)と条件ベクトルをもつCOSMOSデータで訓練します。
条件ベクトルは3の特徴量(銀河のサイズ、明るさ、宇宙距離)のみです
1) C-VAE(conditional VAE)
VAEなので隠れ変数を仮定します。は具体的には多変量の平均と分散を表します。
VAEはデータから次の生成モデルの隠れ変数及びパラメータを求めることになります。
隠れ変数を媒介とする変分の教科書は以下なので
ここで
を使った
隠れ変数を使ったの対数尤度の変分は次式で定義できます。
VAEの損失関数が最小となる隠れ変数及びパラメータを深層学習で算出します
2) C-GAN(conditnal GAN)
条件付敵対的生成モデルGANでは次式で定式化できます。
ここで
このGANは隠れ変数の介在で解けないのでで一様乱数としています
は生成器 C-VAEの を使います
は一般の識別器
(1.2) 結果
COSMOSデータ(特徴量3個)についてRealが銀河の実写で C-VAEとC-GANが生成結果です。
生成結果は何れもノイズが除去されています。
GALAXY-ZOOデータでGANで生成した結果です。但しこのデータの特徴量は37個のベクトルですので、精緻画像が得られています。