NAIST-IS-MT0251010: Ryu Iida

照応解析のための文脈的手がかりを考慮した機械学習モデル

飯田龍 (0251010)

センタリング理論のような言語学的な知見を，機械学習を用いた照応解析に統合する一方法を提案する．従来の照応解析手法は，おおきく規則ベースの手法と統計的な手法に分類でき，それぞれ独立に研究がなされてきた．規則ベースの手法では，言語学的知見に基づき人手で規則を記述するが，照応現象を包括的に捉える規則を書き尽くすことは困難である．一方，機械学習に基づく手法では，人手では扱うことのできない規則の組合せを考慮できるが，言語学的知見を有効に活用していない．これら2つの手法をうまく統合することによって，両者の利点を同時に引き出すことができれば，精度の向上がさらに期待できる．本論文では2つの手法の統合を目指し，具体的な方法として(i)センタリング理論に基づく局所的な文脈を考慮した素性（センタリング素性）の導入，および (ii) 先行詞候補間を比較するモデル（トーナメントモデル）の2点を提案する．この提案手法を用いて日本語ゼロ代名詞の同定を行い，先行研究の機械学習を用いた手法より精度よく先行詞の同定ができたことを報告する．また，トーナメントモデルを拡張した名詞句照応解析のモデルも提案し，このモデルを用いた名詞句照応解析の実験結果についても報告する．