AI論文

エネルギーベースの逆強化学習の論文を再読する

ランニングできず 英語できず (1) エネルギーベースの逆強化学習の論文を再読する 「Maximum Entropy Deep Inverse Reinforcement Learning」 https://arxiv.org/abs/1507.04888 T研のMゼミでかなり以前に解説した論文でしたが、敵対的な逆強化学習の提案で…

深層学習でプログラムを自動生成する論文を読む

ランニング30分 英語できず (1) 深層学習でプログラムを自動生成する論文を読む 「DeepCoder:Learning to Write Programs」 https://www.microsoft.com/en-us/research/publication/deepcoder-learning-write-programs/ この論文は下図の様なInput配列とOutp…

画像から原因と結果を識別する論文を読む

(1) 画像から原因と結果を識別する論文を読む 「Discovering Causal signals in Images」https://arxiv.org/abs/1605.08179 これもhttps://twitter.com/miyamotok0105さん主催の「酒を飲みながらCVPR2017の論文を読む会」で興味を持った一つです。 この論文…

交通事故が起こる危険な場面の画像生成の論文を読む

ランニング30分 英語できず (1) 交通事故が起こる危険な場面の画像生成の論文を読む 「Expecting the Unexpected:Training Detectors for Unusual Pedestrians with Adeversarial Imposers」 https://scirate.com/arxiv/1703.06283 この論文は歩行者の危険な…

DeepMindのDQN統合版のRainBowの論文を読む

ランニング30分 英語できず (1) DeepMindのDQN統合版のRainBowの論文を読む 「Rainbow:Combining Imporvements in Deep Reinforcement Learning」https://arxiv.org/abs/1710.02298 2013年に発表されたDeepMind社のDQNの派生版を統合したRainbowの高パフォー…

複数人が競争する環境での強化学習の論文を読む

ランニングできず 英語できず (1) 複数人が競争する環境での強化学習の論文を読む 「Emergent Complexity via Multi-Agent Competition」https://arxiv.org/abs/1710.03748 複数の学習者が競争する環境は設定し易い環境ですが、強化学習にとっては最も複雑な…

難易度が高いゴールを自動的に見つける強化学習

ランニング30分 英語できず (1) 難易度が高いゴールを自動的に見つける強化学習 「Automatic Goal Generation for Reinforcement Learning Agents」 https://arxiv.org/abs/1705.06366 この論文には米国のロボット学の権威 Abbeel が参加しています。このモ…

分散型・敵対的生成モデルを使った逆強化学習の論文を読む

ランニング30分 英語できず (1)分散型・敵対的生成モデルを使った逆強化学習の論文を読む 「OptionGAN:Learning Joint Reward-Policy Options using Generative Adversarial Inverse Reiforement Larning」https://arxiv.org/abs/1709.06683 この論文は逆強…

強化学習に敵対する学習の論文を読む

ランニングできず 英語できず (1) 強化学習に敵対する学習の論文を読む https://arxiv.org/abs/1703.06748kore これはAttariゲームの強化学習(Q-learning A3C)を効果的に敵対(妨害)するモデルの論文です。 敵対的な戦略として次の方法を採っています。 ・効…

文体のパターンの繰返しで深層学習する論文を読む

ランニングできず 英語できず (1) 文体のパターンの繰返しで深層学習する論文を読む 「Dynamic Evaluation of Neural Sequence Models」 https://arxiv.org/abs/1709.07432 一般に自然言語の深層学習では単語間の繋がりをLSTMで学習することが殆どですが、近…

強化学習方程式の不確実性を報酬に取込む論文を読む

テニス2時間 英語できず (1) 強化学習方程式の不確実性を報酬に取込む論文を読む 「The Uncertaintry Bellman Equation and Exploration」 https://arxiv.org/abs/1709.05380 この論文は強化学習を解くBellman方程式の近似解での不確実性を見積りより精緻に…

3D動画よりDoll House画像を生成する論文を読む

ランニング30分 英語できず (1) 3D動画よりDoll House画像を生成する論文を読む 「MatterPort3D: Learning from RGB-D Data in Indoor Environments」 https://arxiv.org/abs/1709.06158 この論文は屋内をMatterPort3Dと云う動画で撮ると、深層学習により屋…

CNN最適化の制御式を生成するRNNの論文を読む

ランニングできず 英語できず (1) CNN最適化の制御式を生成するRNNの論文を読む 「Neural Optimizer Search with Reinforcement Learning」 https://arxiv.org/abs/1709.07417 CNNの最適化の制御式をRNNが強化学習で学習するモデルでかなり画期的なモデルで…

DeepMindの外部メモリーによる生成モデルの論文を読む

ランニング30分 英語できず (1) DeepMindの外部メモリーによる生成モデルの論文を読む 「Variational Memory Addressing in Generative Models」https://arxiv.org/pdf/1709.07116.pdf この論文は深層学習の生成モデルVAEやGANで成果を出していることに対抗…

深層生成による暗黒物質探査の論文を読む

テニス2時間 英語できず (1)深層生成による暗黒物質探査の論文を読む 「Enabling Dark Energy Science of with Deep Generative Models of Galaxy Images」 https://arxiv.org/abs/1609.05796 宇宙の80%を占めると云われている暗黒物質は宇宙膨張の謎を解…

深層強化学習によるChatbotモデルの論文を読む

ランニング30分 英語:movie 2012 (1) 深層強化学習によるChatbotモデルの論文を読む 「A Deep Reinforcement Learning Chatbot」https://arxiv.org/abs/1709.02349 この論文はアマゾンの2017年の人工知能モデル競技会で開発された応答会話モデルMILABOTの詳…

プレイヤーと環境とが敵対的に学習する論文を読む

ランニングできず 英語できず (1) プレイヤーと環境とが敵対的に学習する論文を読む 「Learning to Design Games: Strategic Environments in Reinforcement Learning」 https://arxiv.org/abs/1707.01310v2 この論文は強化学習でプレイヤーと活動する環境と…

問題解決の効率化の論文を読む

ランニングできず 英語できず (1) 問題解決の効率化の論文を読む Arguments for the Effectiveness of Human Problem Solving - Paper Detail この論文は深層学習のHPで紹介されており、人工知能の提唱者であるSolomonoffレイ・ソロモノフ - Wikipediaの定理…

ImageNetの深層学習を24分間で達成した論文を読む

ランニングできず 英語:英語でOpenpose予測モデルを発表 (1) ImageNetの深層学習を24分間で達成した論文を読む [1709.05011v1] ImageNet Training in 24 Minutes 以前なら1ヶ月ぐらいかかったImageNetの深層学習が24分で済ませたという衝撃的なタイトルで…

Abbeelの相手の様子を見る強化学習の論文を読む

ランニングできず 英語できず (1) Abbeelの相手の様子を見る強化学習の論文を読む 「Learning with Opponent-Learning Awareness」https://arxiv.org/abs/1709.04326 ロボット学の第一人者のAbbeelが参加している敵対的強化学習の論文です。この強化学習はタ…

Attentionによる機械翻訳の論文を読む

ランニングできず 英語できず (1) Attentionによる機械翻訳の論文を読む 「Effective Approaches to Attention-based Neural Machine Translation」(2015/09/20) https://arxiv.org/abs/1508.04025 最近の自然言語処理ではAttentionは必ず聞く言葉なので、ど…

RNNで巡回問題を解く論文を読む

ランニング30分 英語できず (1) RNNで巡回問題を解く論文を読む 「Pointer Network」https://arxiv.org/abs/1506.03134 この論文は深層学習による自然言語処理でよく参照されるが、グラフィカルモデルの最適解も行えるので興味を持ち読んでみました。 まず有…

領域識別による写真の色調転移の論文を読む

ランニングできず 英語できず (1) 領域識別による写真の色調転移の論文を読む 「Deep Photo Style Transfer」https://arxiv.org/abs/1703.07511 この論文も大変綺麗な写真が多数表示されていて有名なものです。この論文は情景が異なる入力と参照の2写真があ…

人工生命環境で生存競争定理の再現の論文を読む

ランニング30分 英語できず (1) 人工生命環境で生存競争定理の再現の論文を読む [1709.04511] An Empirical Study of AI Population Dynamics with Million-agent Reinforcement Learning 自然界と同じ様に狩をする捕食動物(Predator)と獲物(prey)が存在し…

敵対的VAEの論文を読む

ランニングできず 英語できず (1)敵対的VAEの論文を読む 「Adversarial Autoencodes」https://arxiv.org/abs/1511.05644 前のCyclicに画像を学習するモデルでは敵対的VAEを使っていたので、その論文を読みました。 様々な癖がある手書き文字が数種類ある場合…

画像の転移学習を繰返し訓練する論文を読む

ランニングできず 英語できず (1) 画像の転移学習を繰返し訓練する論文を読む 「Unpaired Image-to-Image Translation using Cycle-Consistent Adversalial Networks」https://arxiv.org/abs/1703.10593 この論文は本年初頭に発表され、かなり綺麗な画像が生…

道路交通標識を誤判別させるモデルの論文を読む

ランニング30分 英語できず (1) 道路交通標識を誤判別させるモデルの論文を読む 「Robust Physical-World Attacks on Machine Learning Models」https://arxiv.org/abs/1707.08945v3 本年4月ころに日産の自動運転の技術者の講演では人命に関わる問題なので…

ダーウィン進化論を使った深層学習の最適化の論文を読む

ランニング30分 英語できず (1)ダーウィン進化論を使った深層学習の最適化の論文を読む 「Deep Learning with Darwin: Evolutionary Synthesis of Deep Neural Networks」 https://arxiv.org/abs/1606.04393v3 このモデルはダーウィンの進化論の発想から深層…

物体の2Dイメージを階層的に3Dにする論文を読む

ランニング30分 英語できず (1) 物体の2Dイメージを階層的に3Dにする論文を読む 「Hierarchical Surface Prediction for 3D Object Reconstruction」 https://arxiv.org/abs/1704.00710 この論文は2Dイメージに立方体を当てはめて境界をCNNで認識させて3…

一方向から見た 2Dの画像を3Dにする論文を読む

ランニングできず 英語できず (1)一方向から見た 2Dの画像を3Dにする論文を読む 「3D Object Reconstruction from a Single Depth View with Adversarial Learning」 https://arxiv.org/abs/1708.07969 この論文は1方向から見た画像(2.5D画像)を3D画像に…