確率・統計

DeepMindの2D画像から3D動画を生成するGQNの論文を読んでみる

GQNは下図の様に隠れた物体が写っている2Dの画面を様々な方向から見た3D画像にして評判になっているが、これは現象から実体(3Dでの位置)を掴むベイズ式をうまく実用化しているからである。 まさしくプラトンのイデア論[1]を実現した画期的な試みである。画…

データ分析ツールPADOCの発表

間違って2018/07/29日の記事を削除してしまったので再掲です。 データ前処理研究会でデータ分析ツールPADOCを発表してきました。 データ分析での前処理の議論が殆どないので、業務分析を兼ねたデータ前処理が全工程の7割を占めることが認識されていない様だ…

逆強化学習の深層学習版をC言語で実装してみた

年末にC言語でSGD(確率勾配法)で逆強化学習を実装したが、深層学習版でも実装してみました。 SGDと結果は殆ど変わりませんが、PRMLの5章にあるチューニング無しのロジックの深層学習なので相当時間がかかりました(約3分 SGD版の100倍)。 示せたことはC…

逆強化学習をC言語で実装してみた

(1) 逆強化学習をC言語で実装してみた 計算機どうしが互いに強化するモデル(敵対モデル)を構成するには、単独での初期学習が充実していないと実現しないのは、アルファー碁やbonanzaの示す所と考えています。 そこで敵対モデルを一般的に拡張した場合での…

VAEによる半教師学習の論文を再読する

(1) VAEによる半教師学習の論文を再読する [1406.5298] Semi-Supervised Learning with Deep Generative Models T研のMゼミでの発表でこの論文を再読する。 再度して判明したことは ・変分限界の式以外は殆ど理解していなかった ・この論文は省略が多く難し…

エネルギー関数によるGANの論文を再読する

ランニングできず 英語できず (1) Bengioエネルギー関数によるGANの論文を再読する 「Deep Directed Generative Models with Energy-Based Probability Estimation」https://arxiv.org/abs/1606.03439 逆強化学習で最も一般的なエネルギーベースモデルが理解…

深層学習でプログラムを自動生成する論文を読む

ランニング30分 英語できず (1) 深層学習でプログラムを自動生成する論文を読む 「DeepCoder:Learning to Write Programs」 https://www.microsoft.com/en-us/research/publication/deepcoder-learning-write-programs/ この論文は下図の様なInput配列とOutp…

画像から原因と結果を識別する論文を読む

(1) 画像から原因と結果を識別する論文を読む 「Discovering Causal signals in Images」https://arxiv.org/abs/1605.08179 これもhttps://twitter.com/miyamotok0105さん主催の「酒を飲みながらCVPR2017の論文を読む会」で興味を持った一つです。 この論文…

分散型DQNの論文を読む

ランニング30分 英語できず (1) 分散型DQNの論文を読む 「A Distributional Perspective on Reinforcement Learning」 https://arxiv.org/abs/1707.06887 この論文はDeepMindのDQNの派生モデルを統合したRainbowの中核を成すもので、DQNに初めて行動価値関数…

DeepMindのDQN統合版のRainBowの論文を読む

ランニング30分 英語できず (1) DeepMindのDQN統合版のRainBowの論文を読む 「Rainbow:Combining Imporvements in Deep Reinforcement Learning」https://arxiv.org/abs/1710.02298 2013年に発表されたDeepMind社のDQNの派生版を統合したRainbowの高パフォー…

Abbeelの対等な敵対的ロボットの論文を読む

ランニング30分 英語できず (1) Abbeelの対等な敵対的ロボットの論文を読む 「Continuous Adaptation via Meta-Learning in Nonstationary and Competitive Environments」https://arxiv.org/abs/1710.03641 対等な敵対的モデルはOpen-AIの手作りのカリキュ…

安定的な動作を保持するTRPOの論文を読む

ランニングできず 英語:Toiec 30分 (1) 安定的な動作を保持するTRPOの論文を読む 「Trust Region Policy Optimization」https://arxiv.org/abs/1502.05477 この論文はロボットの強化学習で革新的な貢献をしたモデルです。UC Berkeleyのロボットチームの Shul…

一般化報酬による高次元の強化学習の論文を読む

ランニングできず 英語できず (1) 一般化報酬による高次元の強化学習の論文を読む 「High - Dimensional Continuous Control using Generated Advantage Estimation」 https://arxiv.org/abs/1506.02438 ゲームの強化学習ではQ-learningが一般的ですが、人間…

複数人が競争する環境での強化学習の論文を読む

ランニングできず 英語できず (1) 複数人が競争する環境での強化学習の論文を読む 「Emergent Complexity via Multi-Agent Competition」https://arxiv.org/abs/1710.03748 複数の学習者が競争する環境は設定し易い環境ですが、強化学習にとっては最も複雑な…

ベイズ方式による多腕バンディッドの論文を読む

テニススクール90分 英語できず (1) ベイズ方式による多腕バンディッドの論文を読む 「Gaussian Process Optimization in the Bandit Setting:No Regret and Experimental Design」https://arxiv.org/abs/0912.3995 バンディッドとはスロットマシンのことで…

Efronの曲率による最尤値推定の論文を読む

ランニングできず 英語できず (1) Efronの曲率による最尤値推定の論文を読む 「Curvature and Inference for Maximum Likelihood Estimations」 http://statweb.stanford.edu/~ckirby/brad/papers/2016CurvatureInferenceMLEs.pdf T研のMゼミで解説された …

中国人達の深層Treeモデルの論文を読む

ランニングできず 英語できず (1) 中国人達の深層Treeモデルの論文を読む 「Deep Forest: Towards an Alternative to Deep Neural Networks」 https://arxiv.org/abs/1702.08835 これは下図にある様にランダムフォレストを単に多層化したアンサンブル型モデ…

PRMLのカルマンフィルターの変換行列の学習を理解する

ランニングできず 英語できず (1) PRMLのカルマンフィルターの変換行列の学習を理解する 「PRML 13§ 13.3.2 Learing in LDS」 カルマンフィルターの状態方程式はシステムモデルと観測モデルに分離して表現されます。 システム・モデル 但し 観測モデル 先日…

PRMLのカルマン・フィルターの理論を理解する

ランニングできず 英語できず (1) PRMLのカルマン・フィルターの理論を理解する 「PRML §13.3 Linear Dynamic System」 Openposeの多関節の動画は多次元の時系列のため、多次元時系列が解析できる次の開発済みのモデルで性能比較を行うことにしました。 ・隠…

敵対的VAEの論文を読む

ランニングできず 英語できず (1)敵対的VAEの論文を読む 「Adversarial Autoencodes」https://arxiv.org/abs/1511.05644 前のCyclicに画像を学習するモデルでは敵対的VAEを使っていたので、その論文を読みました。 様々な癖がある手書き文字が数種類ある場合…

道路交通標識を誤判別させるモデルの論文を読む

ランニング30分 英語できず (1) 道路交通標識を誤判別させるモデルの論文を読む 「Robust Physical-World Attacks on Machine Learning Models」https://arxiv.org/abs/1707.08945v3 本年4月ころに日産の自動運転の技術者の講演では人命に関わる問題なので…

 混合分布を隠れ変数とするVAEの論文を読む

ランニングできず 英語できず (1) 混合分布を隠れ変数とするVAEの論文を読む 「VAE with a VampPrior」[1705.07120v3] VAE with a VampPrior KingmaのVAE(Variational Auto encoder)は深層学習に始めて生成モデルを導入した画期的な業績となっています。従来…

一方向から見た 2Dの画像を3Dにする論文を読む

ランニングできず 英語できず (1)一方向から見た 2Dの画像を3Dにする論文を読む 「3D Object Reconstruction from a Single Depth View with Adversarial Learning」 https://arxiv.org/abs/1708.07969 この論文は1方向から見た画像(2.5D画像)を3D画像に…

NIPS2016の論文採択の手続きの分析論文を読む

ランニング30分 英語できず (1) NIPS2016の論文採択の手続きの分析論文を読む [1708.09794v1] Design and Analysis of the NIPS 2016 Review Process NIPSには投稿したことが無いが、この採択システムに興味を持ち読んでみた。 NIPSの論文採択の問題点は、機…

On-lineの株価予測で使うSCWの論文を読む

ランニング30分 英語できず (1) On-lineの株価予測で使うSCWの論文を読む [Exact Soft Confidence-Weighted Learning」https://arxiv.org/abs/1206.4612 この論文はICML2012で有名になったもので、時系列の次期の状態をOn-Lineで予測するものです。 時系列の…

人の名前で国籍や民族を分析したの論文を読む

ランニングできず 英語できず (1) 人の名前で国籍や民族を分析したの論文を読む 「Nationality Classification Using Name Embeddings」 https://arxiv.org/abs/1708.07903v1 5700万のe-mailとtwitter分析して名前で国籍や民族が判明するか分析した論文です…

部分観測型の強化学習の文献を読む

ランニング30分 英語:Toeic (1) 部分観測型の強化学習の文献を読む 「確率ロボット 16章 POMDPの近似手法」※POMDP(Partially Observable Marcov Decision Process) この文献は下記のThrunの「Probabilistic Robotic」を千葉工大の上田隆一先生が訳したもので…

Googleが発表したBlack-Box型の最適化サービスの報告を読む

テニス2時間 英語:toeic Googleが発表したBlack-Box型の最適化サービスの報告を読む Google Vizier: A Service for Black-Box Optimization 機械学習系の汎用的な最適化をCloudでサービスする報告である。Black-Boxである点に興味を持って読んでみたがBlack…

深層型EMモデルの論文を読む

ランニング30分 英語:toeic 深層型EMモデルの論文を読む 「Neural Expection Maximization」https://arxiv.org/abs/1708.03498 最近はやりの深層学習型の生成モデルである。スイスのAI研究所IDSIAが投稿したものである。 基本的に生成モデルはデータから隠れ…

DeepMindとヒントンによる配置認識の生成モデルの論文を読む

ランニング30分 英語できず DeepMindとヒントンの状況認識の生成モデルの論文を読む 「Attend,Infer,Repeat:Fast Scene Understannding with Generative Models」 https://arxiv.org/abs/1603.08575 DeepMindのハサビスのサーベイ論文「人間の脳と人工知能」…