T研で数学の秀才の解説を聞き凹む

ランニングできず 英語できず (1) DeepMindの「Imagination -Augemented Agents For Deep Reinforcement Learning 」を読みはじめる。 [1707.06203] Imagination-Augmented Agents for Deep Reinforcement Learning これは同時に投稿されたModel-basedの行動…

DeepMindの行動選択の論文を纏める

テニス2時間 英語30分 Toeic (1) DeepMindの行動選択に模擬の選択を入れた論文「learning model-based plannning from scratch」を一応読了する。 この模擬モデルは既にAlpha碁のRLモデルで早碁モデルとして採用されていたので、今さらと思えるが、不確定な…

DeepMindの行動計画の論文を読む

ランニングできず 英語20分 Toeic問題 (1) DeepMindの7月に投稿された4本目の論文 「Learning Model-Based Planning from scrach」を読む。これはModel-basedの問題解決のため計画をするLSTMモデルである。同時に出された「Imagenation-Augumented Agents …

Lie群の本を読む

ランニング30分 英語できず (1) 「曲がった空間の幾何学」宮岡礼子の14章 Lie群を読む。DeepMindのNeural Turing Machine がLie群上の多様体で実現しているとの主張をハーバードの論文がしているためにLie群を理解しようとする。 https://arxiv.org/abs/1602…

企業の不芳情報の自然言語解析が始まる

ランニングできず 英語できず (1) 職場で企業の不芳情報の自然言語解析を求められる。今回は不芳情報の言葉の種類と倒産との関係を調べるだけなので所謂Bag Of Wordの頻度分析となる。この様な初歩的な事が分析可能である事が現場では分らなかったらしく長く…

ROSのLT大会 優秀だが統計的アプローチは無い

テニススクール90分 英語できず (1) Lie-Access Neural Turing Machine の論文の纏めの続き。M君やF君の資料を読み解釈の修正をする。F君の資料にLie-Accessがあり先見性に驚いたが、NTMがLie群上で解釈できるとは思っていない様だ。 (2) ROSのLT大会に参加…

Lie-Access Neural Turing Machineを纏める

ランニングできず 英語できず (1)引き続き Lie-access Neural Turing Machine を読む。この論文は2つに分かれている。 1) DeepMindのNeural Turing Machine(NTM)が以下の複雑なパターンの学習できる理由 ・a b c d e f g ⇔ g f e d b aと逆を教えると x y w…

Lie群上のNeural Turing Machineの論文を読み始める

ランニング30分 英語:StarWars (1)DeepMindのNeural Turing Machine(NTM)が何故旨くいくかについてLie群上で理論解明したハーバード大学のLie-Access Neural Turing Machine を読み始める。 https://arxiv.org/abs/1602.08671 これはT研のM先生の解説で知っ…

OpenPoseの時系列解析資料を作成し始める

テニス30分 英語できず (1)大学の研修として OpenPoseで撮った骨格の時系列解析資料と擬似データを作成し始める。テーマはスポーツの動きを時系列で解析して、その熟達度レベルを判別するモデルとする。まずはLSTM用とHMM用のデータの擬似データPADOCツール…

DeepMindの多様な環境で順番学習の有用性の論文

ランニング30分 英語できず (1) DeepMindの論文「多様な環境での身体特性の出現」を読む。 表題:Emagency of Locomotion Beheviors in Rich Enviroments https://arxiv.org/abs/1707.02286 動画: www.youtube.com これは、GANによる強化学習「Learning hum…

DeepMindの強化学習のGAN論文を読む

ランニング30分 英語30分 Leon (1)またDeepMindの2足歩行の身体動作のGANモデルの論文を読む Learning human behaviors from motion capture by adversarial imitation https://arxiv.org/abs/1707.02201 動画 Learning human behaviours from motion captu…

Pythonのデータ処理方法に疑問を持つ

ランニングできず 英語できず (1) Xgboostの結果をAUC指標で計算するプログラムで悩む。Pythonには7つもデータ集団の型がある。皆同じデータの塊だが各々異なるメソッドがあるので、データ処理は相当複雑になる。 List Array Table Set Dictionaly DataForm…

DeepMindのProgrammable Agentを読んだ

テニス90分 英語できず (1) DeepMind Programmable Agentを読んだ 所謂zero-shot(未経験)の知識を獲得するモデルの話。UNREALの自然言語理解がone-shot(経験知識)なので、こちらは与えられたプログラムで状況を理解して、未知な状況を認識する。表題はこれを…

Neural Turing Machineの理論背景が明らかになった

ランニングできず 英語30分 Fly to then Moon (1)T研の機械学習ゼミでM先生の発表を聞く。DeepMindの「Neural Turing Machine」の理論背景が下記の論文で解明され、これの解説 https://arxiv.org/abs/1611.02854 Neural Tureing Machine では下記の様なこと…

xgboostでは欠損が入った文字の扱いが難しい

ランニングできず 英語できず (1) やっとPython版のxgboostが実行できた。R版は2,3日で実行できたが、Python版は参照できるサイトが少なく、自分でプログラムを作成する必要があった。悩んだのは以下の点 ・xgboostが数値しか受け付けない ・データにコード…

DeepMindのNeural Turing Machineの解説が楽しみ

テニス2時間 英語できず (1) Programmable Agentを引き続き読む。明示的な特徴量を抽出してRLで解く方式は 一般的であるが、これをプログラムとして一般化する理屈は誤植もあり説明が理解できていない。 (2) 明後日に T研の機械学習ゼミでM先生がDeepMindの…

DeepMindのProgramable Agentを読む

テニス・ランニング2時間 英語 30分 Bone Idendity (1) SNSからの情報で、DeepMindの下記論文を読み始める。 https://arxiv.org/abs/1706.06383 DeepMindの3D世界の自然言語理解については、One-Shot学習で敵対的学習や転移学習の一般化や拡張する理解が行わ…

DeepMindが自然言語理解の2難題を解決した

ランニングできず 英語30分 The Boune Leagacy (1) DeepMindの自然言語を理解するUNREALモデルの論文を読み、深い感動を覚える。 このモデルは自然言語理解に於ける2つの懸案事項を解決している。 ・計算機が言語を教える事を可能にした。 言語理解で正解す…

DeepMindのUNREALの自然言語理解

ランニングできず 英語30分 (1) DeepMind UNREALでの自然言語理解の論文を読む Grounded Language Learning in a Simulated 3D World | DeepMind これは迷路ゲームの中に報酬が複数ある。 a)報酬の取り方の順序を自然言語で与える。 b)実際にその順番で報酬…

DeepMindのUNREALでの暗黙の特徴量

ランニング30分 英語:How the West Won (1) Deep MindのUNREALを読む。このモデルは迷宮(Labyrinth)Gameを対象としているので、コーナを曲がると別画面になるため、直接に画像から特徴量を抽出するDQNモデルは1部しか使えない。 このモデルでは、様々な暗…

DeepMindのUNREALを再度読む

ランニング30分 英語できず (1) データからベイジアンネット生成による特徴量は、データ項目が十分あり、そこからネットを構成するノードに限定できたものとなる。データ項目に含まれない場合、認識できない。逆強化学習も十分な特徴量を構成できるデータ項…

データからベイジアンネットを自動生成モデルを使う

ランニングできず 英語できず (1) 動的ベイジアンネットによるロボット制御では、Thrunの確率ロボテックスのPOMDPでも行っている。これは方策πが確信度の関数で最大価値Vを計算するモデルであるので、確信度を動的ベイジアンネットで計算するものである。 ベ…

動的ベイジアンネットのノードが特徴量の空間を張る

ランニングできず 英語できず (1) 特徴量抽出の論文を探す。古いが、ようやく強化学習で動的ベイジアンネットによる特徴量抽出の論文に行き当たる。やはり確率的遷移のベイジアンネットの各ノードが特徴量を張るのかと思い当たる。 https://www.researchgate…

大学の研修の被監査で、想定通り失望する

ランニングできず 英語できず (1) 確率ロボテックス輪読 15章POMDP 方策(確信度)による価値推定 (2) Singularity勉強 特徴量の摘出の文献探し (3) 大学の研修の被監査 監査人はデザイン出身の若い学者 殆ど中身が理解できないので、プレゼンの方法のみ監査…

Singularity-QLearning

ランニング30分 英語できず (1) Singularityの問題を詳細に詰め始める。数理的に明快なQ学習から行う。 Q学習はDQNモデルの設定とする。 ・Q関数が下記で与えられる場合 ここでは状況s 行動a後 状況s'のi番目特徴量を示す ・損失関数 ・損失関数の偏微分 Q関…

大学の研修の方向性が決まる

ランニングできず 英語できず (1) Singularityの説明を大学の研修で説明するも、自分でも未消化であることが明白になった。 (2)大学の研修では、ラベリングが簡単な動作(バスケットボールのシュート等)をOpenPoseで多数データを取り、時系列解析して回帰分…

Singularityの試行No.2

ランニングできず 英語できず (1) Singularity達成の問題を引き続き詰める 定義:計算機が考えるとは以下の処理とする 計算機上で 現実的な動きをするオブジェクトが複数存在する。 自己オブジェクト以外のオブジェクトには確率的な動作が加わる 自己オブジ…

Singularityの試案

ランニング30 英語できず (1) 学校の研修の企画書のため、Singularityモデルの資料を作成し始める。 Singularityとは、計算機が自分で考える機能を持つことと定義 計算機が自分で考えるとは以下と捉える。 考えるとは、計算機が最適な方策を決定するまで、以…

OpenPose論文の資料を作成した

ランニング30分 英語30分 (1)DeepLearningでの生成モデルを開発したIan Goodfellowのインタビューを聞くが殆ど聞き取れない。新たなな課題が発生してしまった。 (2) OpenPoseの論文について資料を作成する。CNNというEnd-To-Endのパターン認識機能だけでも凄…

OpenPoseのPAFモデル

ランニング30分 英語30分 Ian Goodfellowのインタビュー Ep. 25: Google's Ian Goodfellow on How an Argument in a Bar Led to Generative Adversarial Networks by The AI Podcast | Free Listening on SoundCloud (1) OpenPose論文の身体構造解析の理解 …

OpenPose論文の発想に唖然とする

ランニング30分 英語:必ず途中で寝てしまう (1)引き続きOpenPoseの論文を読む。 https://arxiv.org/abs/1611.08050 この手の秀逸な論文を読むと学力・技術・発想の乖離に唖然としてしまう。 ・単純なCNNの画像処理でなく、もはやCNNの組合せで構成されてい…

ボトムアップ型のOpenPoseの論文を読む

ランニング30分 英語30分 (1)ラズパイマウスを起動してもsshで入れない。ラズパイマウスには画面もないし、リセットボタンも存在せず、sshで接続できないと電源OFFしか対処できずOSディスクが破壊される可能性がある。やもなく電源OFFしラズパイ用の画面を装…

python Xgboostがやっと動く

ランニングできず 英語できず (1)職場のPCでvirtualBox-Linux-python-xgboostがやっと動いた。windows+R+xgboostはすぐ稼動したが、Openな時代にCloseに固執するwindowsに見切りをつけLinuxに切り替える。難航していたのは以下の点 ・恐ろしいことに金融機…

LSD-SLAMを稼動してもらった

ランニング30分 英語できず (1)LSD-SLAM用のPCの手配を大学に依頼すると、大学のM先生がVirtualBox+Ubuntu14+IndigoでLSD-SLAMを稼動させてくれた。特徴量抽出のデータ生成で一歩程度前進だ。M先生からORB-SLAMもあるとのこと。これは上田先生の講演で紹介し…

高度なOpenソースは相当OSの知識が必要になっている

ランニング30分 英語できず (1) 当初難航が想定された3D-SLAMのインストールがうまく行かず、やはりUbuntu14+Indigo(ROS)でないと無理の様である。Openソースによる技術発展は非常に有益だが、OS環境自体も発展するので、相当OSの知識がないと扱えない領域…

迷路探索ゲームの論文を読み始める

ランニング30分 英語20分 (1)3D上の特徴量の解析のため、3D-SLAMとしてLDS-SLAMのインストールを試みる。下記サイトに詳細な方法が記述されている。このサイトではUbuntu14 ROS:Indigoとなっている。 趣味なし奴のメモ帳: LSD-SLAMをROSで試す1-インストー…

シンギュラリティの具体的な問題を考える

ランニングできず 英語できず (1)シンギュラリティの可能性が指示を集められない理由とその打開策を模索する。Arxiv SanityでSingularityを検索したが殆どヒットしないので文献に頼れないことになる 状況を表す「特徴量」と課題の「解決状態」だけ入力すれば…

先端のAI研究者は1日10本論文を読む

ランニングできず 英語できず (1) 確率ロボット輪読会に参加。9~13章のSLAMが終了し、強化学習の章になってほっとする。ここではBellman方程式による方策関数と価値関数の両方の実装が必要になっており先進的なモデルである事がわかる。両関数も非線形なの…

協調型の強化学習の論文を読む

ランニングできず 英語できず (1) マルチエージェントの強化学習モデルの論文を読む。この動画はこのモデルでの対戦模様である。 https://arxiv.org/abs/1703.10069 このモデルは双方向RNNであるBiCN(BiDirectionally Coordinated Network)が2つで構成され…

AI論文読み会の資料にシンギュラリテイを盛り込む

ランニングできず 英語30分 (1) CMUの留学生がOpenPoseの動画デモを見に大学に来たので少し話す。OpenPoseを見に来たので相手の専攻をBioInfomaticと言っているのをBioPhotometricと聞き間違い、以降すれ違いの会話となってしまった。英語は先入観で全く異な…

マルチエージェントモデルの論文を初めて読む

テニススクール90分 英語できず (1) テニスで運動した後、図書館で下記の強化学習系の論文を読む。目的はGame場面毎の特徴量の抽出方法を探るため ・DeepMindの擬似カウントモデル https://arxiv.org/abs/1703.01310 N社のSさんから教えてもらったDeepMindの…

動作がある場面の特徴量の抽出では、有向のベイジアンネットが使えると考える

ランニングできず 英語できず (1)T研の機械学習ゼミで解説があったGANの理論背景の論文を再読することにする。 https://arxiv.org/abs/1610.03483 途中まで読んで、これは確率密度比の理論と思っていたが、再読すると殆ど理解していない事に愕然とする。 (2)…

Steinモデルによる生成モデルに注目する

ランニングできず 英語できず (1) Bengioの論文の未理解部分を再検討し、1箇所を除き漸く納得した。未解明部分はエントロフィの算出部分であるがプログラム見るしかない。不明だった点として実験例に手書き数字の変遷過程が掲載されている。例えば8と3の…

Bengioのエネルギーベースの生成モデルを纏める

テニス2時間 英語できず (1) BengioのEnergy-Baseの生成モデルを纏める。このモデルはGANではなく、安定エネルギーに向かってデータを生成しているモデルである。しかしエネルギー関数は敵対的な関数を採用している。いつもながら資料を作ってみると細かい…

言語解析の経験の無さを自覚する

ランニングできず 英語できず (1) 大学でチーム別の研究発表会があり、内容が幼稚でこの大学の教育レベルでは廃校になる可能性が高い。ただ工業デザインでは有名なので、それなりの学生が集まるらしく秀逸な研究もあった。 (2)J研で大学院の説明会に参加し、…

Bengioのエネルギーベースの生成モデルを読む

ランニング30分 英語15分 (1) 超有名なBengioが参加しているエネルギーベースの生成モデルの論文を読む。DeepLearningの生成モデルでエネルギー関数を使ってGANを数理的に厳密化したものである。流石に理論も拡張性もありすばらし論文である。GANでは生成器…

Alpha碁がシンギュラリティと思っている人は少ない様だ

ランニングできず 英語できず (1) TwitterにAlpha碁がシンギュラリティだと投稿したが反応なし。計算機が自分で考え出す状態をシンギュラリティと云うが、自分の大学のDeepLearningの先生もそうだが、皆分っていないらしくチャンスとも思える。Alpha碁の構造…

エネルギーベースのGAN論文に取り組む

テニススクール90分 英語できず (1) 最近英語のヒアリングをしていない為か、かなり映画とか聞き取れなくなっている。 (2) Fさんから、自動運転の50万円講習の案内を受け取る。 www.nikkeibp.co.jp この案内にはPDFの技術資料があり参考になった。 1位置測…

敵対的な仕掛けはVAEを元に考えるべき

ランニング30分 英語できず (1)AI論文を読むのは、「巨人の肩に乗る」ことなので相当体力が要ることが分り、若い時代にしておくべきと悔やんでも遅い。T先生から師匠 竹内啓先生の話で論文には3種類あるので注意が必要との話があり、論文を探す場合は緊張す…

敵対的関係を使った特徴量の学習の論文を読む

ランニングできず 英語できず (1) 敵対的関係がシンギュラリィテイの鍵と信じて論文検索すると下記の特徴量の学習に敵対的関係を使っている論文に行き当たる。 Controllable Invariant Through Adversarial Feature Learning https://arxiv.org/abs/1705.111…