Abbeelの論文アルゴリズムは報酬が得やすい初期状態の探索になっている

AI論文ロボテックス

テニス４時間英語：できず (1)AbbeelのGoalからの強化学習の論文の下記のアルゴリズムがGoalからStartへ明示的に逆に辿る手続きになっていなく、理解が難しい。このAlgorithm1の４、５行目のをStartsに入れているのは間違に見えるが、Goal近辺から摂動を与…

2017-07-30

確率ロボテックスが改めて難しい理論と再認識する

ランニングできず英語：20分 Toiec (1) Tゼミで「確率ロボットの輪講15章」一ヶ月振りのせいもあるが、やはりPOMDP（部分観察マルコフ決定過程）は難しいと感じた。POMDPの文献は本当に少なくチャンスとも云えるので詳細に読むことにする。あとは16章のみ残…

2017-07-29

ロボット学で学習手順を生成する論文を読む

AI論文ロボテックス

ランニング30分英語できず (1) 米国のロボット学の権威Pieter Abbeelが参加した論文「Reverse Curriculm Generation for Reinforcement Learning」を読む。これは最終目的から初期状態へ逆に解く強化学習によって自動操縦手順を自動生成するモデルである。 …

2017-07-28

DeepMindの倉庫番ゲームの論文を纏める

AI論文ロボテックス

ランニングできず英語：Toeic (1) DeepMindの倉庫番ゲームの論文「Imagination-Augmented Agent s for Deep Reiforcement Learning」がやっと読了した。難航した理由は以下である。・重要な単語の意味の取り間違え（Augmented →Argmented rollout→rollove…

2017-07-27

DeepMindのI2Aモデルの倉庫番ゲームの論文を読む

AI論文

ランニング30分英語できず (1) 学校の研修用に以前書いたOpenPoseの論文資料からアルゴリズムを１枚に纏める Open posedoc (2) DeepMindの行動計画の論文「Imagination-Augmented Agents for Deep Reinforcement Learning」(I2A)を引き続き読む。このモデ…

2017-07-26

Pythonで不芳情報の言葉のカウントをする

Python

ランニングできず英語できず (1) 企業の自然言語の不芳情報分析を開始する。・まず形態要素解析のMecabをインストールする $sudo apt-get install libmecab-dev user #mecabインストール $sudo apt-get install mecab mecab-ipadic-utf8 #辞書のインストー…

2017-07-25

T研で数学の秀才の解説を聞き凹む

AI論文確率・統計

ランニングできず英語できず (1) DeepMindの「Imagination -Augemented Agents For Deep Reinforcement Learning 」を読みはじめる。 [1707.06203] Imagination-Augmented Agents for Deep Reinforcement Learning これは同時に投稿されたModel-basedの行動…

2017-07-24

DeepMindの行動選択の論文を纏める

テニス２時間英語30分 Toeic (1) DeepMindの行動選択に模擬の選択を入れた論文「learning model-based plannning from scratch」を一応読了する。この模擬モデルは既にAlpha碁のRLモデルで早碁モデルとして採用されていたので、今さらと思えるが、不確定な…

2017-07-23

DeepMindの行動計画の論文を読む

ランニングできず英語20分 Toeic問題 (1) DeepMindの７月に投稿された４本目の論文「Learning Model-Based Planning from scrach」を読む。これはModel-basedの問題解決のため計画をするLSTMモデルである。同時に出された「Imagenation-Augumented Agents …

2017-07-22

Lie群の本を読む

ランニング30分英語できず (1) 「曲がった空間の幾何学」宮岡礼子の14章 Lie群を読む。DeepMindのNeural Turing Machine がLie群上の多様体で実現しているとの主張をハーバードの論文がしているためにLie群を理解しようとする。 https://arxiv.org/abs/1602…

2017-07-21

企業の不芳情報の自然言語解析が始まる

自然言語解析確率・統計

ランニングできず英語できず (1) 職場で企業の不芳情報の自然言語解析を求められる。今回は不芳情報の言葉の種類と倒産との関係を調べるだけなので所謂Bag Of Wordの頻度分析となる。この様な初歩的な事が分析可能である事が現場では分らなかったらしく長く…

2017-07-20

ROSのLT大会　優秀だが統計的アプローチは無い

AI論文ロボテックス

テニススクール90分英語できず (1) Lie-Access Neural Turing Machine の論文の纏めの続き。M君やF君の資料を読み解釈の修正をする。F君の資料にLie-Accessがあり先見性に驚いたが、NTMがLie群上で解釈できるとは思っていない様だ。 (2) ROSのLT大会に参加…

2017-07-19

Lie-Access Neural Turing Machineを纏める

AI論文

ランニングできず英語できず (1)引き続き Lie-access Neural Turing Machine を読む。この論文は２つに分かれている。 1) DeepMindのNeural Turing Machine(NTM)が以下の複雑なパターンの学習できる理由・a b c d e f g ⇔ g f e d b aと逆を教えると x y w…

2017-07-18

Lie群上のNeural Turing Machineの論文を読み始める

ランニング30分英語:StarWars (1)DeepMindのNeural Turing Machine(NTM)が何故旨くいくかについてLie群上で理論解明したハーバード大学のLie-Access Neural Turing Machine を読み始める。 https://arxiv.org/abs/1602.08671 これはT研のM先生の解説で知っ…

2017-07-17

OpenPoseの時系列解析資料を作成し始める

確率・統計

テニス30分英語できず (1)大学の研修として OpenPoseで撮った骨格の時系列解析資料と擬似データを作成し始める。テーマはスポーツの動きを時系列で解析して、その熟達度レベルを判別するモデルとする。まずはLSTM用とHMM用のデータの擬似データPADOCツール…

2017-07-16

DeepMindの多様な環境で順番学習の有用性の論文

AI論文ロボテックス

ランニング30分英語できず (1) DeepMindの論文「多様な環境での身体特性の出現」を読む。表題：Emagency of Locomotion Beheviors in Rich Enviroments https://arxiv.org/abs/1707.02286 動画： www.youtube.com これは、GANによる強化学習「Learning hum…

2017-07-15

DeepMindの強化学習のGAN論文を読む

ランニング30分英語30分 Leon (1)またDeepMindの２足歩行の身体動作のGANモデルの論文を読む Learning human behaviors from motion capture by adversarial imitation https://arxiv.org/abs/1707.02201 動画 Learning human behaviours from motion captu…

2017-07-14

Pythonのデータ処理方法に疑問を持つ

確率・統計

ランニングできず英語できず (1) Xgboostの結果をAUC指標で計算するプログラムで悩む。Pythonには７つもデータ集団の型がある。皆同じデータの塊だが各々異なるメソッドがあるので、データ処理は相当複雑になる。 List Array Table Set Dictionaly DataForm…

2017-07-13

DeepMindのProgrammable Agentを読んだ

AI論文ロボテックス

テニス90分英語できず (1) DeepMind Programmable Agentを読んだ所謂zero-shot(未経験)の知識を獲得するモデルの話。UNREALの自然言語理解がone-shot(経験知識)なので、こちらは与えられたプログラムで状況を理解して、未知な状況を認識する。表題はこれを…

2017-07-12

Neural Turing Machineの理論背景が明らかになった

AI論文

ランニングできず英語30分 Fly to then Moon (1)T研の機械学習ゼミでM先生の発表を聞く。DeepMindの「Neural Turing Machine」の理論背景が下記の論文で解明され、これの解説 https://arxiv.org/abs/1611.02854 Neural Tureing Machine では下記の様なこと…

2017-07-11

xgboostでは欠損が入った文字の扱いが難しい

確率・統計

ランニングできず英語できず (1) やっとPython版のxgboostが実行できた。R版は2,3日で実行できたが、Python版は参照できるサイトが少なく、自分でプログラムを作成する必要があった。悩んだのは以下の点・xgboostが数値しか受け付けない・データにコード…

2017-07-10

DeepMindのNeural Turing Machineの解説が楽しみ

テニス２時間英語できず (1) Programmable Agentを引き続き読む。明示的な特徴量を抽出してRLで解く方式は一般的であるが、これをプログラムとして一般化する理屈は誤植もあり説明が理解できていない。 (2) 明後日に T研の機械学習ゼミでM先生がDeepMindの…

2017-07-09

DeepMindのProgramable Agentを読む

AI論文ロボテックス

テニス・ランニング2時間英語 30分 Bone Idendity (1) SNSからの情報で、DeepMindの下記論文を読み始める。 https://arxiv.org/abs/1706.06383 DeepMindの3D世界の自然言語理解については、One-Shot学習で敵対的学習や転移学習の一般化や拡張する理解が行わ…

2017-07-08

DeepMindが自然言語理解の２難題を解決した

AI論文ロボテックス

ランニングできず英語30分 The Boune Leagacy (1) DeepMindの自然言語を理解するUNREALモデルの論文を読み、深い感動を覚える。このモデルは自然言語理解に於ける２つの懸案事項を解決している。・計算機が言語を教える事を可能にした。言語理解で正解す…

2017-07-07

DeepMindのUNREALの自然言語理解

AI論文ロボテックス

ランニングできず英語30分 (1) DeepMind UNREALでの自然言語理解の論文を読む Grounded Language Learning in a Simulated 3D World | DeepMind これは迷路ゲームの中に報酬が複数ある。 a)報酬の取り方の順序を自然言語で与える。 b)実際にその順番で報酬…