T研で数学の秀才の解説を聞き凹む
ランニングできず 英語できず
(1) DeepMindの「Imagination -Augemented Agents For Deep Reinforcement Learning 」を読みはじめる。
[1707.06203] Imagination-Augmented Agents for Deep Reinforcement Learning
これは同時に投稿されたModel-basedの行動計画の論文「Learning model-based planning from scratch」とは関係ない。
I2As(Imagination-Argumented Agentes)と称しており、下図の右端にある様にModel-basedとこれを蒸留したModel-freeを束ねた複雑なモデルである。この蒸留モデルを追加することによって解が安定すると言っている。
(2) T研の機械学習ゼミで数学の天才Iさんの下記の解説を聞く。
https://projecteuclid.org/euclid.aos/1382547511
T研の機械学習の研究室にはNIPSに投稿できる数学の秀才が数人おり、全くとんでもなく難しい話を聞くはめになる。無限次元のノンパラ回帰でWavletを組合わせこれに適切な重みを与えれば収束できるとの話であるが、プライヤーを任意にできる所がよく分らなかった。流石にレベルの壁にぶつかって凹んだ。