DeepMindのProgramable Agentを読む

テニス・ランニング2時間 英語 30分 Bone Idendity

(1) SNSからの情報で、DeepMindの下記論文を読み始める。

https://arxiv.org/abs/1706.06383

DeepMindの3D世界の自然言語理解については、One-Shot学習で敵対的学習や転移学習の一般化や拡張する理解が行われていない。この論文では強化学習でロジックを一般的に生成する事を目指しており、こちらはZero-Shotを使った敵対関係に類似したモデルで構成されている。

 Verifier ⇔ search procedure