確率・統計

Bradley-Terryを使ったツイッター分析の論文を読む

ランニング30分 英語:できず 神嶌先生が出てくるツイッター分析の論文を読む 「被フォロー順序に基づくユーザの役割推定方法の提案」(2017) http://db-event.jpn.org/deim2017/papers/209.pdf 以前書いた人間の感性を利用した強化学習で、2つのゲームビデ…

openPoseの解析結果の時系列データの作成作業

ランニング30分 英語できず (1) openPoseの解析結果の時系列データの作成作業 大学の研修でopenPoseによる予測モデルの構築をしている。現在はバスケットのフリースロー動作からの予測点数の推定モデル openPose資料 Open posedoc from Masato Nakai www.sli…

Jordanの深層とカーネルによる転移学習の論文を読む

ランニングできず 英語できず (1) Micheal Jordanが参加している転移学習の論文を読む。 「Learning Transferable Features with Deep Adaptation Networks」https://arxiv.org/abs/1502.02791 この人は有名なバスケットのJordanと同じ姓名なので、文書分類…

DeepLearning系の生成モデルのツールEdwardの論文を読む

ランニングできず 英語できず (1) DeepLearning系の生成モデルのツールEdwardの論文を読む。 「Deep Probabilistic Programming」 [1701.03757] Deep Probabilistic Programming 相当ハイレベルの人や知人から紹介されていたEdwardツールの論文である。 正直…

DeepMindの方向性を纏める

テニススクール90分 英語:movie Fully (1)DeepMindのハザビスの「脳科学とAIの関連」の記事を纏める 「Neuroscience inspiered AI」 何故この様な記事が書いたのか理由の推察であるが、DQNやAlpha碁の偉大な事業を深層強化学習で達成したが、さらに複雑な事…

T研で数学の秀才の解説を聞き凹む

ランニングできず 英語できず (1) DeepMindの「Imagination -Augemented Agents For Deep Reinforcement Learning 」を読みはじめる。 [1707.06203] Imagination-Augmented Agents for Deep Reinforcement Learning これは同時に投稿されたModel-basedの行動…

企業の不芳情報の自然言語解析が始まる

ランニングできず 英語できず (1) 職場で企業の不芳情報の自然言語解析を求められる。今回は不芳情報の言葉の種類と倒産との関係を調べるだけなので所謂Bag Of Wordの頻度分析となる。この様な初歩的な事が分析可能である事が現場では分らなかったらしく長く…

OpenPoseの時系列解析資料を作成し始める

テニス30分 英語できず (1)大学の研修として OpenPoseで撮った骨格の時系列解析資料と擬似データを作成し始める。テーマはスポーツの動きを時系列で解析して、その熟達度レベルを判別するモデルとする。まずはLSTM用とHMM用のデータの擬似データPADOCツール…

Pythonのデータ処理方法に疑問を持つ

ランニングできず 英語できず (1) Xgboostの結果をAUC指標で計算するプログラムで悩む。Pythonには7つもデータ集団の型がある。皆同じデータの塊だが各々異なるメソッドがあるので、データ処理は相当複雑になる。 List Array Table Set Dictionaly DataForm…

xgboostでは欠損が入った文字の扱いが難しい

ランニングできず 英語できず (1) やっとPython版のxgboostが実行できた。R版は2,3日で実行できたが、Python版は参照できるサイトが少なく、自分でプログラムを作成する必要があった。悩んだのは以下の点 ・xgboostが数値しか受け付けない ・データにコード…

大学の研修の方向性が決まる

ランニングできず 英語できず (1) Singularityの説明を大学の研修で説明するも、自分でも未消化であることが明白になった。 (2)大学の研修では、ラベリングが簡単な動作(バスケットボールのシュート等)をOpenPoseで多数データを取り、時系列解析して回帰分…

python Xgboostがやっと動く

ランニングできず 英語できず (1)職場のPCでvirtualBox-Linux-python-xgboostがやっと動いた。windows+R+xgboostはすぐ稼動したが、Openな時代にCloseに固執するwindowsに見切りをつけLinuxに切り替える。難航していたのは以下の点 ・恐ろしいことに金融機…

動作がある場面の特徴量の抽出では、有向のベイジアンネットが使えると考える

ランニングできず 英語できず (1)T研の機械学習ゼミで解説があったGANの理論背景の論文を再読することにする。 https://arxiv.org/abs/1610.03483 途中まで読んで、これは確率密度比の理論と思っていたが、再読すると殆ど理解していない事に愕然とする。 (2)…

Steinモデルによる生成モデルに注目する

ランニングできず 英語できず (1) Bengioの論文の未理解部分を再検討し、1箇所を除き漸く納得した。未解明部分はエントロフィの算出部分であるがプログラム見るしかない。不明だった点として実験例に手書き数字の変遷過程が掲載されている。例えば8と3の…

明示的知識ベースによるNLP分析の論文を読む

ランニングできず 英語できず (1)知識ベースを使うNLPのサーベイ論文の纏めを行う。 LDAで著名なT先生の意見では、wordNet等の明示的な知識ベースを使ったNLP分析は効果が出ないとの指摘であったが、今回の論文を読み、明示的知識ベースを使うと精度が高めら…

NLPの知識ベースの論文をやっと読むが再度熟読が必要となる

ランニングできず 英語30分 Lesson33 (1) やっとMachine Learning with world Knowlegを読む。5/8日に投稿されたNLPの知識表現を網羅的に扱った論文で、冒頭の2点の問題設定に引き込まれたが、 ・知識表現の特徴量抽出の技術 ・文章要約の技術 基本的には参…