Singularityの試行No.2
ランニングできず 英語できず
(1) Singularity達成の問題を引き続き詰める
定義:計算機が考えるとは以下の処理とする
計算機上で 現実的な動きをするオブジェクトが複数存在する。
自己オブジェクト以外のオブジェクトには確率的な動作が加わる
自己オブジェクトは目的を達成するまで、以下を繰返す。
A)自己オブジェクト目的に照らして現状況の価値を推定する
B)状況の価値を最も損なう他オブジェクトの動作を推定できる
C)障害動作に従って、現状での最適な行動を選択し新状況にする
方法:
A)の価値推定の方法(GANによる状況生成)
自己や各オブジェクトの現実的な行動をGANで複数生成して、目的達成
まで模擬する。その達成確率が高い程、状況の価値は高いとする。
B)障害行動の推定方法(敵対的モデル)
自己オブジェクトの目的を阻害することを目的とする敵対的モデルで
阻害行動を生成する。敵対オブジェクトは目的以外は自己オブジェクトと
同じモデルである。
C)最適行動選択の方法(Q学習)
他オブジェクトの阻害行動の状況下で、自己の選択行動後毎に生起する状況
の価値を計算する。その行動で価値を偏微分して、その最大傾斜を採る
行動の組合わせと最適行動とする。