グラフクラスタリングによる共参照解析

松田 昇悟 (1451098)


共参照解析は、文書内に存在する現実世界の実体を表す句に対して,それぞれを同じ実体を示すもの同士でクラスタリングを行う処理である.これまでMention-Pairモデルと呼ばれる, 先行詞と照応詞のペアから得られる情報を使って共参照を判定するモデルが提案されてきた. しかし, Mention-Pairモデルでは現在判定を行っている先行詞と照応詞の情報のみしか利用することができず, それまでに決定している先行詞の情報や実体のクラスタの情報を利用することができない.

そこで本研究では, コミュニティ抽出で用いられるグラフクラスタリングの手法を使うことで先行詞と照応詞のペアだけでなく周辺の句の情報を利用することができるモデルを提案する. 実験の結果,現在までに提案されてきたMention-Pairモデルと比較して高い精度を達成することができた.加えて近年主流である手法と同等の精度を達成することができた.