Tree LSTMと強化学習の論文を読む

ランニングできず 英語できず

 薬が切れたため、一旦実家に戻る。

 NLPに強化学習を適用したDeepMind社の論文を読む。

https://arxiv.org/abs/1611.09100

ICPR21017で発表されたもので、以下の特徴がある。

・文法の知識が必要とせず、文章の構造はTree型LSTMでShiftとReduceで生成していく

・文章が旨く生成されたか判断する報酬は、主に感情分析(LSTMによる2値分類)の確率で与えるが、Perplextyで評価するsentence Generationも使った報酬も考えている。

f:id:mabonki0725:20170504080423p:plain

 中国人達が考えた、人間の翻訳を半教師学習とするGANでの翻訳システムの論文を途中まで読む。これで飛躍的に人間の翻訳精度に近くなったとあり、驚異を感ずる。

[1704.06933] Adversarial Neural Machine Translation

 先生と学生から報告があったのでROS課題、「ロボットとの会話」「ロボットのカメラ画像」に取組む。RaspiとDLサーバとの通信はできたが、両方ともパッケージの登録ができず挫折する。この分野はNet上の英語情報を見て失敗を繰返しながら習得する様だ。かなり壁を感じる。