2017-05-08

PredNetの論文を読み始める

自然言語解析 AI論文

テニス２時間　英語できず

　引き続き、RLとMMLによるプログラム生成の論文をBeamSearchまで読む。

RLとMMLは共通の定式化が可能なのは、GANとIRLが同じという理論の反対の定式化であろう。

　TwitterのYutaさんの投稿で有名なPredNetの論文を読んでみる気になる。ネットワーク図を見た時、実装や収束ができるか疑問だったが、DNCで精緻なNNモデルが実現できているので可能かもしれない。

https://arxiv.org/abs/1605.08104

　連休明けで今日から仕事が始まる。まずpythonに習熟することから始めよう。

2017-05-07

筑波自動走行チャレンジの資料で課題を再認識する

ロボテックス自然言語解析

ランニングできず　英語 30分 Lesson17

　体調がすぐれず午前中寝ていた。

　午後大学で研修の打合せ、T君がラズパイマウスを稼動する様にしてくれて助かる。筑波チャレンジをO先生が企画しており、また千葉工大の原祥尭先生のROSによる詳細な資料が見つかり、ようやくROSによる自動走行の理論的課題が明確になってくる。やはりSLAMのグラフィカルモデルのデータ集約の方法の改善が技術的な課題と認識できる。２年来のこの課題がラズパイマウスで追求できるか楽しみである。

https://www.slideshare.net/hara-y/ros-slam-navigation-rsj-seminar

f:id:mabonki0725:20170507054124p:plain

　昨日に続き強化学習とMMLで発話の内容をプログラム化する論文を読む。類を見ない大胆なチャレンジと感じる。

https://arxiv.org/abs/1704.07926

2017-05-06

GANによる翻訳の論文を評価する

自然言語解析 AI論文

ランニングできず　英語できず

　男性一人では入店禁止の横須賀の猫カフェに女房と一緒に行く。久々に猫を触ってストレスを解消したが、女房が我侭を言うので却って疲れた。

　昨日に続きGANによる翻訳の論文を読む。原文と翻訳文を2次元にして、これをCNNに入れ人間の翻訳ではYesをNMT(機械翻訳)ではFalseをいれてDiscriminatorを学習させている。問題はGeneratorである。本来のGeneratorは乱数からDNNで擬似的なモデルを作るが、機械翻訳は乱数から作れないので、その質を改善するため、Disciminatorの真偽の確率を報酬として汎用的な強化学習の手法をとっている。即ちGeneratorでの翻訳でDiscirimatorを旨く騙せたら高い報酬を、騙せなかったら罰則を与え強化学習をする。

汎用的な強化学習は、特徴量に重みを懸けた線形和で表現し、報酬で重みを改善する仕掛けなので効率が悪い。論文でも学習効率は良くないと言っている。フレームワークとしては発展性があるが、Disicriminatorの情報を効率的に適用するGeneratorの工夫が必要である。　

[1704.06933] Adversarial Neural Machine Translation

f:id:mabonki0725:20170506084412p:plain

　DeepMind社が出した強化学習による自然言語生成論文の再度読む。TreeLSTMなるもので文生成を学習するのだが、文生成がうまくできたかの判断が必要で、これに強化学習での報酬を使っている。判断方法は４つあり、TreeLSTMで生成した文を感情分析の２値判断LSTMモデルに入れ正解率で評価するのが一番わかりやすい。その他の２方法は２文比較をしていて、この２文が何を示しているかよく記述していない。4番目の手法は生成文で単語識別の容易差perplexity=p(w|sentence)で評価するものだ。この単語を何にしているか説明がない。文章の意味をどう価値付けるかの大事な話であり、読み取れないのは残念だ。

https://arxiv.org/abs/1611.09100