2017-07-01から1ヶ月間の記事一覧

Abbeelの論文アルゴリズムは報酬が得やすい初期状態の探索になっている

テニス4時間 英語:できず (1)AbbeelのGoalからの強化学習の論文の下記のアルゴリズムがGoalからStartへ明示的に逆に辿る手続きになっていなく、理解が難しい。 このAlgorithm1の4、5行目のをStartsに入れているのは間違に見えるが、Goal近辺から摂動を与…

確率ロボテックスが改めて難しい理論と再認識する

ランニングできず 英語:20分 Toiec (1) Tゼミで「確率ロボットの輪講15章」一ヶ月振りのせいもあるが、やはりPOMDP(部分観察マルコフ決定過程)は難しいと感じた。POMDPの文献は本当に少なくチャンスとも云えるので詳細に読むことにする。あとは16章のみ残…

ロボット学で学習手順を生成する論文を読む

ランニング30分 英語できず (1) 米国のロボット学の権威Pieter Abbeelが参加した論文「Reverse Curriculm Generation for Reinforcement Learning」を読む。これは最終目的から初期状態へ逆に解く強化学習によって自動操縦手順を自動生成するモデルである。 …

DeepMindの倉庫番ゲームの論文を纏める

ランニングできず 英語:Toeic (1) DeepMindの倉庫番ゲームの論文「Imagination-Augmented Agent s for Deep Reiforcement Learning」がやっと読了した。難航した理由は以下である。 ・重要な単語の意味の取り間違え (Augmented →Argmented rollout→rollove…

DeepMindのI2Aモデルの倉庫番ゲームの論文を読む

ランニング30分 英語できず (1) 学校の研修用に以前書いたOpenPoseの論文資料からアルゴリズムを1枚に纏める Open posedoc (2) DeepMindの行動計画の論文「Imagination-Augmented Agents for Deep Reinforcement Learning」(I2A)を引き続き読む。 このモデ…

Pythonで不芳情報の言葉のカウントをする

ランニングできず 英語できず (1) 企業の自然言語の不芳情報分析を開始する。 ・まず形態要素解析のMecabをインストールする $sudo apt-get install libmecab-dev user #mecabインストール $sudo apt-get install mecab mecab-ipadic-utf8 #辞書のインストー…

T研で数学の秀才の解説を聞き凹む

ランニングできず 英語できず (1) DeepMindの「Imagination -Augemented Agents For Deep Reinforcement Learning 」を読みはじめる。 [1707.06203] Imagination-Augmented Agents for Deep Reinforcement Learning これは同時に投稿されたModel-basedの行動…

DeepMindの行動選択の論文を纏める

テニス2時間 英語30分 Toeic (1) DeepMindの行動選択に模擬の選択を入れた論文「learning model-based plannning from scratch」を一応読了する。 この模擬モデルは既にAlpha碁のRLモデルで早碁モデルとして採用されていたので、今さらと思えるが、不確定な…

DeepMindの行動計画の論文を読む

ランニングできず 英語20分 Toeic問題 (1) DeepMindの7月に投稿された4本目の論文 「Learning Model-Based Planning from scrach」を読む。これはModel-basedの問題解決のため計画をするLSTMモデルである。同時に出された「Imagenation-Augumented Agents …

Lie群の本を読む

ランニング30分 英語できず (1) 「曲がった空間の幾何学」宮岡礼子の14章 Lie群を読む。DeepMindのNeural Turing Machine がLie群上の多様体で実現しているとの主張をハーバードの論文がしているためにLie群を理解しようとする。 https://arxiv.org/abs/1602…

企業の不芳情報の自然言語解析が始まる

ランニングできず 英語できず (1) 職場で企業の不芳情報の自然言語解析を求められる。今回は不芳情報の言葉の種類と倒産との関係を調べるだけなので所謂Bag Of Wordの頻度分析となる。この様な初歩的な事が分析可能である事が現場では分らなかったらしく長く…

ROSのLT大会 優秀だが統計的アプローチは無い

テニススクール90分 英語できず (1) Lie-Access Neural Turing Machine の論文の纏めの続き。M君やF君の資料を読み解釈の修正をする。F君の資料にLie-Accessがあり先見性に驚いたが、NTMがLie群上で解釈できるとは思っていない様だ。 (2) ROSのLT大会に参加…

Lie-Access Neural Turing Machineを纏める

ランニングできず 英語できず (1)引き続き Lie-access Neural Turing Machine を読む。この論文は2つに分かれている。 1) DeepMindのNeural Turing Machine(NTM)が以下の複雑なパターンの学習できる理由 ・a b c d e f g ⇔ g f e d b aと逆を教えると x y w…

Lie群上のNeural Turing Machineの論文を読み始める

ランニング30分 英語:StarWars (1)DeepMindのNeural Turing Machine(NTM)が何故旨くいくかについてLie群上で理論解明したハーバード大学のLie-Access Neural Turing Machine を読み始める。 https://arxiv.org/abs/1602.08671 これはT研のM先生の解説で知っ…

OpenPoseの時系列解析資料を作成し始める

テニス30分 英語できず (1)大学の研修として OpenPoseで撮った骨格の時系列解析資料と擬似データを作成し始める。テーマはスポーツの動きを時系列で解析して、その熟達度レベルを判別するモデルとする。まずはLSTM用とHMM用のデータの擬似データPADOCツール…

DeepMindの多様な環境で順番学習の有用性の論文

ランニング30分 英語できず (1) DeepMindの論文「多様な環境での身体特性の出現」を読む。 表題:Emagency of Locomotion Beheviors in Rich Enviroments https://arxiv.org/abs/1707.02286 動画: www.youtube.com これは、GANによる強化学習「Learning hum…

DeepMindの強化学習のGAN論文を読む

ランニング30分 英語30分 Leon (1)またDeepMindの2足歩行の身体動作のGANモデルの論文を読む Learning human behaviors from motion capture by adversarial imitation https://arxiv.org/abs/1707.02201 動画 Learning human behaviours from motion captu…

Pythonのデータ処理方法に疑問を持つ

ランニングできず 英語できず (1) Xgboostの結果をAUC指標で計算するプログラムで悩む。Pythonには7つもデータ集団の型がある。皆同じデータの塊だが各々異なるメソッドがあるので、データ処理は相当複雑になる。 List Array Table Set Dictionaly DataForm…

DeepMindのProgrammable Agentを読んだ

テニス90分 英語できず (1) DeepMind Programmable Agentを読んだ 所謂zero-shot(未経験)の知識を獲得するモデルの話。UNREALの自然言語理解がone-shot(経験知識)なので、こちらは与えられたプログラムで状況を理解して、未知な状況を認識する。表題はこれを…

Neural Turing Machineの理論背景が明らかになった

ランニングできず 英語30分 Fly to then Moon (1)T研の機械学習ゼミでM先生の発表を聞く。DeepMindの「Neural Turing Machine」の理論背景が下記の論文で解明され、これの解説 https://arxiv.org/abs/1611.02854 Neural Tureing Machine では下記の様なこと…

xgboostでは欠損が入った文字の扱いが難しい

ランニングできず 英語できず (1) やっとPython版のxgboostが実行できた。R版は2,3日で実行できたが、Python版は参照できるサイトが少なく、自分でプログラムを作成する必要があった。悩んだのは以下の点 ・xgboostが数値しか受け付けない ・データにコード…

DeepMindのNeural Turing Machineの解説が楽しみ

テニス2時間 英語できず (1) Programmable Agentを引き続き読む。明示的な特徴量を抽出してRLで解く方式は 一般的であるが、これをプログラムとして一般化する理屈は誤植もあり説明が理解できていない。 (2) 明後日に T研の機械学習ゼミでM先生がDeepMindの…

DeepMindのProgramable Agentを読む

テニス・ランニング2時間 英語 30分 Bone Idendity (1) SNSからの情報で、DeepMindの下記論文を読み始める。 https://arxiv.org/abs/1706.06383 DeepMindの3D世界の自然言語理解については、One-Shot学習で敵対的学習や転移学習の一般化や拡張する理解が行わ…

DeepMindが自然言語理解の2難題を解決した

ランニングできず 英語30分 The Boune Leagacy (1) DeepMindの自然言語を理解するUNREALモデルの論文を読み、深い感動を覚える。 このモデルは自然言語理解に於ける2つの懸案事項を解決している。 ・計算機が言語を教える事を可能にした。 言語理解で正解す…

DeepMindのUNREALの自然言語理解

ランニングできず 英語30分 (1) DeepMind UNREALでの自然言語理解の論文を読む Grounded Language Learning in a Simulated 3D World | DeepMind これは迷路ゲームの中に報酬が複数ある。 a)報酬の取り方の順序を自然言語で与える。 b)実際にその順番で報酬…

DeepMindのUNREALでの暗黙の特徴量

ランニング30分 英語:How the West Won (1) Deep MindのUNREALを読む。このモデルは迷宮(Labyrinth)Gameを対象としているので、コーナを曲がると別画面になるため、直接に画像から特徴量を抽出するDQNモデルは1部しか使えない。 このモデルでは、様々な暗…

DeepMindのUNREALを再度読む

ランニング30分 英語できず (1) データからベイジアンネット生成による特徴量は、データ項目が十分あり、そこからネットを構成するノードに限定できたものとなる。データ項目に含まれない場合、認識できない。逆強化学習も十分な特徴量を構成できるデータ項…

データからベイジアンネットを自動生成モデルを使う

ランニングできず 英語できず (1) 動的ベイジアンネットによるロボット制御では、Thrunの確率ロボテックスのPOMDPでも行っている。これは方策πが確信度の関数で最大価値Vを計算するモデルであるので、確信度を動的ベイジアンネットで計算するものである。 ベ…

動的ベイジアンネットのノードが特徴量の空間を張る

ランニングできず 英語できず (1) 特徴量抽出の論文を探す。古いが、ようやく強化学習で動的ベイジアンネットによる特徴量抽出の論文に行き当たる。やはり確率的遷移のベイジアンネットの各ノードが特徴量を張るのかと思い当たる。 https://www.researchgate…

大学の研修の被監査で、想定通り失望する

ランニングできず 英語できず (1) 確率ロボテックス輪読 15章POMDP 方策(確信度)による価値推定 (2) Singularity勉強 特徴量の摘出の文献探し (3) 大学の研修の被監査 監査人はデザイン出身の若い学者 殆ど中身が理解できないので、プレゼンの方法のみ監査…