動作がある場面の特徴量の抽出では、有向のベイジアンネットが使えると考える

ランニングできず 英語できず

(1)T研の機械学習ゼミで解説があったGANの理論背景の論文を再読することにする。

https://arxiv.org/abs/1610.03483

途中まで読んで、これは確率密度比の理論と思っていたが、再読すると殆ど理解していない事に愕然とする。

(2) 現在人手で行っている応諾業務をXgboostでモデル化するとAUCが98%と出ているとの報告がある。これは異常に高い値なので、2つの可能性がある。 

 ・応諾の結果を反映した変数がモデルの説明変数に使われている

 ・人手の応諾がかなり機械的な処理をしている

一般的には前者だが、入力変数を精査する限り該当変数が見当たらない。もし後者ならかなり人手を削減することが出来るかもしれない。

(3) XgboostをPythonで使うためインストールするが、途中でエラーになるため難航する。原因をネットで調べるが情報が存在しない。S助教に相談するため学校に行くとCudaコマンド一つでインストールできることが分る。オープンソースについてはネット上に情報が溢れ、最初にどれがヒットするかで後続の操作が異なる状態になっている。この様な情報の整理も非常に大事だと認識した。

Installation Guide — xgboost 0.6 documentation

(4)S助教とAlpha碁がシンギュラリティを達成したかについて少し話しをする。広い分野でのシンギュラリティを達成するには、対象問題をどの様に特徴量として分解できるかが鍵ということになった。Alpha碁の場合は碁盤とそのルールの限定されたで対象で、これが64の特徴量で構成できると見破ったことが大きい。S助教によれば、現実の世界は場面が変遷する都度に特徴量が入れ替わるのが普通で、もう少し複雑なゲームで考えるべきとの主張である。ゲームにおける特徴量の取得にはDeepMindの論文があったことを思い出す。

[1606.01868] Unifying Count-Based Exploration and Intrinsic Motivation

この問題の特徴量抽出にはデータからベイジアンネットを自動生成するモデルが使えないかと考え始める。この有向グラフィカルモデルは一般に強力なデータ集約機能と因果関係抽出機能があることが判明している。

Bayesian net16409