盛り沢山の成果があったがSocher論文が読めず
ランニングできず 英語できず
(1) 確率ロボッテックスのSLAM9~13章の輪読終了。殆ど理解できず9章から再読中。その理解のため上田先生のSLAMをダウンロードしたがIpythonコードのため、Ipythonインストールするが失敗
https://github.com/ryuichiueda/probrobo_practice
(2)Socherの強化学習とDeepLearningによる要約論文を読み始めるが読了せず。https://arxiv.org/abs/1312.5602
(3)AI勉強会で三好さんのUNREALの講演を聞く。
https://arxiv.org/abs/1611.05397 論文
https://github.com/miyosuda/unreal プログラム
https://speakerdeck.com/miyosuda/tensorflow-and-deepmind-lab-and-unreal 説明資料
特徴としては、以下で構成され強化学習の統合モデルと言える。
A3Cアルゴリズムがbase
Policy選択と価値のCNN+LSTMのDeepLearningモデル
Reword Prediction :睡眠時の学習モデル
Value Function :20フレーム先読みの価値関数
Pixcel Contorol :遷移の多い場面選択Q学習
(4) 学校でOpenPoseのデモがT君の尽力で動画デモができる。動画のDeepLearningのモデルは初めて。隔絶した技術で多方面にかなりのカルチャーショックを与えると思われる。
https://arxiv.org/abs/1312.4659