2017-01-01から1年間の記事一覧
ランニングできず 英語:20分 Toiec (1) Tゼミで「確率ロボットの輪講15章」一ヶ月振りのせいもあるが、やはりPOMDP(部分観察マルコフ決定過程)は難しいと感じた。POMDPの文献は本当に少なくチャンスとも云えるので詳細に読むことにする。あとは16章のみ残…
ランニング30分 英語できず (1) 米国のロボット学の権威Pieter Abbeelが参加した論文「Reverse Curriculm Generation for Reinforcement Learning」を読む。これは最終目的から初期状態へ逆に解く強化学習によって自動操縦手順を自動生成するモデルである。 …
ランニングできず 英語:Toeic (1) DeepMindの倉庫番ゲームの論文「Imagination-Augmented Agent s for Deep Reiforcement Learning」がやっと読了した。難航した理由は以下である。 ・重要な単語の意味の取り間違え (Augmented →Argmented rollout→rollove…
ランニング30分 英語できず (1) 学校の研修用に以前書いたOpenPoseの論文資料からアルゴリズムを1枚に纏める Open posedoc (2) DeepMindの行動計画の論文「Imagination-Augmented Agents for Deep Reinforcement Learning」(I2A)を引き続き読む。 このモデ…
ランニングできず 英語できず (1) 企業の自然言語の不芳情報分析を開始する。 ・まず形態要素解析のMecabをインストールする $sudo apt-get install libmecab-dev user #mecabインストール $sudo apt-get install mecab mecab-ipadic-utf8 #辞書のインストー…
ランニングできず 英語できず (1) DeepMindの「Imagination -Augemented Agents For Deep Reinforcement Learning 」を読みはじめる。 [1707.06203] Imagination-Augmented Agents for Deep Reinforcement Learning これは同時に投稿されたModel-basedの行動…
テニス2時間 英語30分 Toeic (1) DeepMindの行動選択に模擬の選択を入れた論文「learning model-based plannning from scratch」を一応読了する。 この模擬モデルは既にAlpha碁のRLモデルで早碁モデルとして採用されていたので、今さらと思えるが、不確定な…
ランニングできず 英語20分 Toeic問題 (1) DeepMindの7月に投稿された4本目の論文 「Learning Model-Based Planning from scrach」を読む。これはModel-basedの問題解決のため計画をするLSTMモデルである。同時に出された「Imagenation-Augumented Agents …
ランニング30分 英語できず (1) 「曲がった空間の幾何学」宮岡礼子の14章 Lie群を読む。DeepMindのNeural Turing Machine がLie群上の多様体で実現しているとの主張をハーバードの論文がしているためにLie群を理解しようとする。 https://arxiv.org/abs/1602…
ランニングできず 英語できず (1) 職場で企業の不芳情報の自然言語解析を求められる。今回は不芳情報の言葉の種類と倒産との関係を調べるだけなので所謂Bag Of Wordの頻度分析となる。この様な初歩的な事が分析可能である事が現場では分らなかったらしく長く…
テニススクール90分 英語できず (1) Lie-Access Neural Turing Machine の論文の纏めの続き。M君やF君の資料を読み解釈の修正をする。F君の資料にLie-Accessがあり先見性に驚いたが、NTMがLie群上で解釈できるとは思っていない様だ。 (2) ROSのLT大会に参加…
ランニングできず 英語できず (1)引き続き Lie-access Neural Turing Machine を読む。この論文は2つに分かれている。 1) DeepMindのNeural Turing Machine(NTM)が以下の複雑なパターンの学習できる理由 ・a b c d e f g ⇔ g f e d b aと逆を教えると x y w…
ランニング30分 英語:StarWars (1)DeepMindのNeural Turing Machine(NTM)が何故旨くいくかについてLie群上で理論解明したハーバード大学のLie-Access Neural Turing Machine を読み始める。 https://arxiv.org/abs/1602.08671 これはT研のM先生の解説で知っ…
テニス30分 英語できず (1)大学の研修として OpenPoseで撮った骨格の時系列解析資料と擬似データを作成し始める。テーマはスポーツの動きを時系列で解析して、その熟達度レベルを判別するモデルとする。まずはLSTM用とHMM用のデータの擬似データPADOCツール…
ランニング30分 英語できず (1) DeepMindの論文「多様な環境での身体特性の出現」を読む。 表題:Emagency of Locomotion Beheviors in Rich Enviroments https://arxiv.org/abs/1707.02286 動画: www.youtube.com これは、GANによる強化学習「Learning hum…
ランニング30分 英語30分 Leon (1)またDeepMindの2足歩行の身体動作のGANモデルの論文を読む Learning human behaviors from motion capture by adversarial imitation https://arxiv.org/abs/1707.02201 動画 Learning human behaviours from motion captu…
ランニングできず 英語できず (1) Xgboostの結果をAUC指標で計算するプログラムで悩む。Pythonには7つもデータ集団の型がある。皆同じデータの塊だが各々異なるメソッドがあるので、データ処理は相当複雑になる。 List Array Table Set Dictionaly DataForm…
テニス90分 英語できず (1) DeepMind Programmable Agentを読んだ 所謂zero-shot(未経験)の知識を獲得するモデルの話。UNREALの自然言語理解がone-shot(経験知識)なので、こちらは与えられたプログラムで状況を理解して、未知な状況を認識する。表題はこれを…
ランニングできず 英語30分 Fly to then Moon (1)T研の機械学習ゼミでM先生の発表を聞く。DeepMindの「Neural Turing Machine」の理論背景が下記の論文で解明され、これの解説 https://arxiv.org/abs/1611.02854 Neural Tureing Machine では下記の様なこと…
ランニングできず 英語できず (1) やっとPython版のxgboostが実行できた。R版は2,3日で実行できたが、Python版は参照できるサイトが少なく、自分でプログラムを作成する必要があった。悩んだのは以下の点 ・xgboostが数値しか受け付けない ・データにコード…
テニス2時間 英語できず (1) Programmable Agentを引き続き読む。明示的な特徴量を抽出してRLで解く方式は 一般的であるが、これをプログラムとして一般化する理屈は誤植もあり説明が理解できていない。 (2) 明後日に T研の機械学習ゼミでM先生がDeepMindの…
テニス・ランニング2時間 英語 30分 Bone Idendity (1) SNSからの情報で、DeepMindの下記論文を読み始める。 https://arxiv.org/abs/1706.06383 DeepMindの3D世界の自然言語理解については、One-Shot学習で敵対的学習や転移学習の一般化や拡張する理解が行わ…
ランニングできず 英語30分 The Boune Leagacy (1) DeepMindの自然言語を理解するUNREALモデルの論文を読み、深い感動を覚える。 このモデルは自然言語理解に於ける2つの懸案事項を解決している。 ・計算機が言語を教える事を可能にした。 言語理解で正解す…
ランニングできず 英語30分 (1) DeepMind UNREALでの自然言語理解の論文を読む Grounded Language Learning in a Simulated 3D World | DeepMind これは迷路ゲームの中に報酬が複数ある。 a)報酬の取り方の順序を自然言語で与える。 b)実際にその順番で報酬…
ランニング30分 英語:How the West Won (1) Deep MindのUNREALを読む。このモデルは迷宮(Labyrinth)Gameを対象としているので、コーナを曲がると別画面になるため、直接に画像から特徴量を抽出するDQNモデルは1部しか使えない。 このモデルでは、様々な暗…
ランニング30分 英語できず (1) データからベイジアンネット生成による特徴量は、データ項目が十分あり、そこからネットを構成するノードに限定できたものとなる。データ項目に含まれない場合、認識できない。逆強化学習も十分な特徴量を構成できるデータ項…
ランニングできず 英語できず (1) 動的ベイジアンネットによるロボット制御では、Thrunの確率ロボテックスのPOMDPでも行っている。これは方策πが確信度の関数で最大価値Vを計算するモデルであるので、確信度を動的ベイジアンネットで計算するものである。 ベ…
ランニングできず 英語できず (1) 特徴量抽出の論文を探す。古いが、ようやく強化学習で動的ベイジアンネットによる特徴量抽出の論文に行き当たる。やはり確率的遷移のベイジアンネットの各ノードが特徴量を張るのかと思い当たる。 https://www.researchgate…
ランニングできず 英語できず (1) 確率ロボテックス輪読 15章POMDP 方策(確信度)による価値推定 (2) Singularity勉強 特徴量の摘出の文献探し (3) 大学の研修の被監査 監査人はデザイン出身の若い学者 殆ど中身が理解できないので、プレゼンの方法のみ監査…
ランニング30分 英語できず (1) Singularityの問題を詳細に詰め始める。数理的に明快なQ学習から行う。 Q学習はDQNモデルの設定とする。 ・Q関数が下記で与えられる場合 ここでは状況s 行動a後 状況s'のi番目特徴量を示す ・損失関数 ・損失関数の偏微分 Q関…