Distance Supervision論文を読む

ランニング30分 英語30分Lesson31

(1) Distance supervision for relation extractionを読む

http://web.stanford.edu/~jurafsky/mintz.pdf

これは言葉間の関係知識ベースFreebaseを使って、ラベル付の文章の特徴量を生成し、ラベルと特徴量から回帰して分類するモデルである。FreebaseはWikipedia等から言葉間の関係を抽出した大規模な知識データベースである。

f:id:mabonki0725:20170603141218p:plain

ラベル付の文章内にある2つの言葉がFreebaseのExampleに一致すれば、その言葉間のRelationがその文章にあるものとする。文章には複数この様な関係があるので、この関係を使って構文解析してその結果で特徴量を決定する。

f:id:mabonki0725:20170603141849p:plain

このモデルの特徴は、文章外の一般知識を元に、文書分類を可能にしていることである。