Abbeelの相手の様子を見る強化学習の論文を読む

ランニングできず 英語できず (1) Abbeelの相手の様子を見る強化学習の論文を読む 「Learning with Opponent-Learning Awareness」https://arxiv.org/abs/1709.04326 ロボット学の第一人者のAbbeelが参加している敵対的強化学習の論文です。この強化学習はタ…

Attentionによる機械翻訳の論文を読む

ランニングできず 英語できず (1) Attentionによる機械翻訳の論文を読む 「Effective Approaches to Attention-based Neural Machine Translation」(2015/09/20) https://arxiv.org/abs/1508.04025 最近の自然言語処理ではAttentionは必ず聞く言葉なので、ど…

RNNで巡回問題を解く論文を読む

ランニング30分 英語できず (1) RNNで巡回問題を解く論文を読む 「Pointer Network」https://arxiv.org/abs/1506.03134 この論文は深層学習による自然言語処理でよく参照されるが、グラフィカルモデルの最適解も行えるので興味を持ち読んでみました。 まず有…

領域識別による写真の色調転移の論文を読む

ランニングできず 英語できず (1) 領域識別による写真の色調転移の論文を読む 「Deep Photo Style Transfer」https://arxiv.org/abs/1703.07511 この論文も大変綺麗な写真が多数表示されていて有名なものです。この論文は情景が異なる入力と参照の2写真があ…

人工生命環境で生存競争定理の再現の論文を読む

ランニング30分 英語できず (1) 人工生命環境で生存競争定理の再現の論文を読む [1709.04511] An Empirical Study of AI Population Dynamics with Million-agent Reinforcement Learning 自然界と同じ様に狩をする捕食動物(Predator)と獲物(prey)が存在し…

敵対的VAEの論文を読む

ランニングできず 英語できず (1)敵対的VAEの論文を読む 「Adversarial Autoencodes」https://arxiv.org/abs/1511.05644 前のCyclicに画像を学習するモデルでは敵対的VAEを使っていたので、その論文を読みました。 様々な癖がある手書き文字が数種類ある場合…

画像の転移学習を繰返し訓練する論文を読む

ランニングできず 英語できず (1) 画像の転移学習を繰返し訓練する論文を読む 「Unpaired Image-to-Image Translation using Cycle-Consistent Adversalial Networks」https://arxiv.org/abs/1703.10593 この論文は本年初頭に発表され、かなり綺麗な画像が生…

道路交通標識を誤判別させるモデルの論文を読む

ランニング30分 英語できず (1) 道路交通標識を誤判別させるモデルの論文を読む 「Robust Physical-World Attacks on Machine Learning Models」https://arxiv.org/abs/1707.08945v3 本年4月ころに日産の自動運転の技術者の講演では人命に関わる問題なので…

 混合分布を隠れ変数とするVAEの論文を読む

ランニングできず 英語できず (1) 混合分布を隠れ変数とするVAEの論文を読む 「VAE with a VampPrior」[1705.07120v3] VAE with a VampPrior KingmaのVAE(Variational Auto encoder)は深層学習に始めて生成モデルを導入した画期的な業績となっています。従来…

交配効果による深層学習の効率化の論文を読む

ランニングできず 英語:Toeic (1)交配効果による深層学習の効率化の論文を読む [1709.02043] The Mating Rituals of Deep Neural Networks: Learning Compact Feature Representations through Sexual Evolutionary Synthesis 月間2000本もAI論文でるので中…

ダーウィン進化論を使った深層学習の最適化の論文を読む

ランニング30分 英語できず (1)ダーウィン進化論を使った深層学習の最適化の論文を読む 「Deep Learning with Darwin: Evolutionary Synthesis of Deep Neural Networks」 https://arxiv.org/abs/1606.04393v3 このモデルはダーウィンの進化論の発想から深層…

物体の2Dイメージを階層的に3Dにする論文を読む

ランニング30分 英語できず (1) 物体の2Dイメージを階層的に3Dにする論文を読む 「Hierarchical Surface Prediction for 3D Object Reconstruction」 https://arxiv.org/abs/1704.00710 この論文は2Dイメージに立方体を当てはめて境界をCNNで認識させて3…

一方向から見た 2Dの画像を3Dにする論文を読む

ランニングできず 英語できず (1)一方向から見た 2Dの画像を3Dにする論文を読む 「3D Object Reconstruction from a Single Depth View with Adversarial Learning」 https://arxiv.org/abs/1708.07969 この論文は1方向から見た画像(2.5D画像)を3D画像に…

NIPS2016の論文採択の手続きの分析論文を読む

ランニング30分 英語できず (1) NIPS2016の論文採択の手続きの分析論文を読む [1708.09794v1] Design and Analysis of the NIPS 2016 Review Process NIPSには投稿したことが無いが、この採択システムに興味を持ち読んでみた。 NIPSの論文採択の問題点は、機…

On-lineの株価予測で使うSCWの論文を読む

ランニング30分 英語できず (1) On-lineの株価予測で使うSCWの論文を読む [Exact Soft Confidence-Weighted Learning」https://arxiv.org/abs/1206.4612 この論文はICML2012で有名になったもので、時系列の次期の状態をOn-Lineで予測するものです。 時系列の…

人の名前で国籍や民族を分析したの論文を読む

ランニングできず 英語できず (1) 人の名前で国籍や民族を分析したの論文を読む 「Nationality Classification Using Name Embeddings」 https://arxiv.org/abs/1708.07903v1 5700万のe-mailとtwitter分析して名前で国籍や民族が判明するか分析した論文です…

Socherの自然文の問合せをSQLに変換する論文を読む

テニス2時間 英語できず (1) Socherの自然言語の問合せをSQLに変換する論文を読む 「Seq2SQL: Generating Structured Queries from Natural Language using Reinforcement Learning」 https://einstein.ai/static/images/layouts/research/seq2sql/seq2sql.…

部分観測型の強化学習の文献を読む

ランニング30分 英語:Toeic (1) 部分観測型の強化学習の文献を読む 「確率ロボット 16章 POMDPの近似手法」※POMDP(Partially Observable Marcov Decision Process) この文献は下記のThrunの「Probabilistic Robotic」を千葉工大の上田隆一先生が訳したもので…

非深層型の進化戦略の強化学習の論文を読む

ランニング30分 英語できず (1) 非深層強化学習の進化戦略の論文を読む 「Evolution Strategies as a Scalable Alternative to Reinforcement Learning」 https://arxiv.org/abs/1703.03864 公開ソース https://github.com/MorvanZhou/Evolutionary-Algorith…

深層強化学習のサーベイ論文を読む

ランニングできず 英語できず 深層強化学習のサーベイ論文を読む 「DeepLearning for Video Game Playing」https://arxiv.org/abs/1708.07902 最近までのPCゲームやテレビゲームを深層学習で解くAI技術について網羅的に解説した論文である。従って深層学習を…

DeepMindの強化学習での歪んだ報酬の対処の論文を読む

テニススクール90分 英語できず DeepMindの強化学習での歪んだ報酬の対処の論文を読む [1705.08417] Reinforcement Learning with a Corrupted Reward Channel この論文は報酬が誤解釈や観測失敗やノイズがある場合の対処を論じたもので、かなり長文で数学よ…

Abbeelの計画問題の強化学習の論文を読む

ランニング30分 英語できず Abbeelの計画問題の強化学習の論文を読む 「Learning Generalized Reactive Plicies using Deep Neural Network」 https://arxiv.org/abs/1708.07280v1 ロボット学の第一人者USCバークレイのPieter Abbeelが参加している倉庫ゲー…

強化学習でDeepLearnigのネット構造を自動生成する論文を読む

ランニングできず 英語:Toeic 強化学習でDeepLearnigのネット構造を自動生成する論文を読む [1708.05552] Practical Network Blocks Design with Q-Learning 下図の様に画像識別型のDeepLearningは限界まで識別精度を上げるため、複雑なネットワーク構成を人…

Googleが発表したBlack-Box型の最適化サービスの報告を読む

テニス2時間 英語:toeic Googleが発表したBlack-Box型の最適化サービスの報告を読む Google Vizier: A Service for Black-Box Optimization 機械学習系の汎用的な最適化をCloudでサービスする報告である。Black-Boxである点に興味を持って読んでみたがBlack…

深層密度予測による擬似回数を報酬とした探索の論文を読む

ランニング30分 英語:Toeic 深層密度予測による擬似回数を報酬とした探索の論文を読む [1703.01310] Count-Based Exploration with Neural Density Models End-to-End(RealTimeで学習しながら問題を解く)のDQNは衝撃を与えたが、解けないゲームが多数ある…

深層型EMモデルの論文を読む

ランニング30分 英語:toeic 深層型EMモデルの論文を読む 「Neural Expection Maximization」https://arxiv.org/abs/1708.03498 最近はやりの深層学習型の生成モデルである。スイスのAI研究所IDSIAが投稿したものである。 基本的に生成モデルはデータから隠れ…

深層強化学習で多次元の行動を分解して学習する論文を読む

ランニング30分 英語:Toeic 深層強化学習で多次元の行動を分解して学習する論文を読む 「Discrete Sequential Prediction of Continuous Action for Deep RL」 https://arxiv.org/abs/1705.05035 DQNでのQ-Learningが高次元のためSGDの深層学習が進まない問…

本能的に学習するロボット実験の論文を読む

ランニング30分 英語:できず (1) 本能的に学習するロボット実験の論文を読む 「Instrinstically Motivated Goal Exploaration Processes with Automatic Curriculum Learning」 https://arxiv.org/abs/1708.02190 今までの強化学習はゴール(目的)が明解で…

DeepMindとヒントンによる配置認識の生成モデルの論文を読む

ランニング30分 英語できず DeepMindとヒントンの状況認識の生成モデルの論文を読む 「Attend,Infer,Repeat:Fast Scene Understannding with Generative Models」 https://arxiv.org/abs/1603.08575 DeepMindのハサビスのサーベイ論文「人間の脳と人工知能」…

医療系の複合現実(MR)の技術サーベイ論文を読む

ランニング30分 英語:Toeic (1) 医療系の複合現実(MR)の技術サーベイ論文を読む 「Recent Developments and Future Challenges in Medical Mixed Reality」 https://arxiv.org/abs/1708.01225 AI会社の社長からこれは凄いという複合現実の論文を紹介された…