ROSを強化学習のライブラリィと認識していて、この誤解解消のため、ROSの意義を述べる。基本的な誤解だったので高圧的な解説になったかと悔やむ。しかしROS-SLAMに長じている人も数人いて、論文で話題になった迫力あるLSD-SLAM(単眼３次元SLAM)のデモを見せてもらう。下記でGITHUBで公開されている。

https://gist.github.com/0V/a3817fa67345bd0cde6c

オープンイノーベションで無料で優秀なツールが次々と出現しており、これらを実装していく方が楽しみが多く、高い壁を次々と越えていく様子を見ると、論文を読み理論から迫る方法は情報も少なく、閉鎖的な技術の時代の方法かもしれない。

2017-05-30

NLPの知識ベースの論文をやっと読むが再度熟読が必要となる

AI論文ラズパイ・マウス確率・統計

ランニングできず　英語30分　Lesson33

(1) やっとMachine Learning with world Knowlegを読む。5/8日に投稿されたNLPの知識表現を網羅的に扱った論文で、冒頭の２点の問題設定に引き込まれたが、

・知識表現の特徴量抽出の技術

・文章要約の技術

基本的には参照先を読んで理解する事が前提で記述してあり、再度の熟読が必要である。

(2)ラズパイマウスの充電器の故障でOSが起動しなかったが、学校に充電器の再購入してもらい、２時間充電でOSが起動した。上田本に従ってラズパイのドライバーの自動設定まで進む。記述が簡潔で上田先生の人柄が良く出ている本と改めて思う。

(3)職場でXGBoostを導入したプロジェクトがシステム部で始まるが、素人同然のコンサル会社が行った事前分析の説明を受けた。

「諾否率が95％のデータで、AIを使うと89％諾否が当たっている」という結論だが、AIの性能が無く全部許諾した場合95％の諾否が当たることになり、この結論は意味が無いことを指摘した。相手も事前分析が全く意味が無いことを認め、混乱が始まった。立場上責任は無いので傍観するしかない。統計には数字の罠が至る所にあり、センスか熟練の何れかが必要である。

2017-05-29

アルファ碁の勝因はGANモデルであること

ロボテックス AI論文

テニス２時間　英語30分 Lesson33

(1) やはりAlpha碁の完勝は、強化学習での敵対的モデル(Adversarial Model)の有効性を証明したと思う。碁の様に天文学的な組合せでの最適化を可能にしたのは、対戦もAlpha碁とした事である。ロボッテクスの性能は、特徴量の選定とそのIRL(逆強化学習）の分配関数Z(θ)の精度で決まる。下記の論文では分配関数は敵対関係モデルで作成できることを示した。そう考えるとAlpha碁の勝因はIRL-GANとそっくりである。

https://arxiv.org/abs/1611.03852

・碁でのよい特徴量64個の抽出に成功した

・棋譜モデル(SL)で熟練者のデータを集めた

・敵対的モデル（RL)を繰返し精度を高めた

ロボッテクスや自動運転でモデルを強化するには、敵対的なモデルで敵対的データを生成し、このデータでモデルを強化する。この相互的補完モデルが性能を左右すると思われる。