含意関係認識と単語分布を利用した歴史の正誤問題への解答

三浦 未来 (1351101)


含意関係認識とは2つの文TとHが与えられた時,Tの意味がHの意味を含意するかどうかを判定するタスクである.この技術は機械翻訳など様々な応用先が考えられる.

NTCIE-10のRITE2では含意関係認識を量して歴史の正誤問題を解くExam Searchタスクが提案された.このタスクは正誤問題をHとみなし,知識源からTを自ら見つけそれらの間の含意関係を推測することでHの正誤を判定する. 従来の研究ではTの獲得について自らは行わずに,オーガナイザーから配布されるTSUBAKIの検索結果を用いるだけであった. また,獲得されたTがHと無関係なものであった時のことを考慮していない.

本発表ではHとTの候補とのTree Edit DistanceをもとにしたTの獲得方法を提案する. また,獲得されたTがHと関係のあるものか否かを判定し,Tが関係のない場合は知識源内でのHの単語分布の情報を用いてHの正誤を判定する方法を説明する.