大規模な依存構造知識を用いた複雑な代名詞照応問題の解決

大西真輝 (14501026)


共参照解析は,文書中から同じ実体を指し示す名詞句をクラスタリングするタスクである. その共参照解析の難しいタスクとして代名詞照応問題が存在し,複雑な文を問題集として,Levesqueらが提唱したWinograd Schema(WS)というものがある. このデータセットは,非常によく似た文でありながら僅かな違いによって代名詞の照応先が変わっている文対からなっている. 我々はこの問題に対し,大規模な文書集合から簡単な共参照を含む文を抽出し,その文の依存構造木を知識として学習することで,精度向上を行った. 結果として,単独素性としては既存の研究のものより5ポイント精度が向上した.