Anaphora Resolution for Japanese Definite Noun Phrases(日本語の直接照応および間接照応の統合的解析)

井之上 直也 (0851009)


我々は,あるモノやコトの情報を伝達するとき,様々な言語表現を用いる.例えば,「麻生首相」について述べるときは「首相」「あの人」などの表現を用い,さらに「夫人」「年齢」などの表現を用いて麻生首相の属性や性質などの情報を伝達する.このとき,「麻生首相」(先行詞)と「首相」「年齢」などの表現(照応詞)の間には照応関係があるといい,自然言語処理の分野では,この照応関係を特定する処理を照応解析と呼ぶ.照応解析は,情報検索や機械翻訳などの自然言語処理のアプリケーションにおいて,非常に重要な基盤技術である.

照応関係には,上の例からも明らかなように,直接的な指示の関係である直接照応(「麻生首相」と「あの人」など)と,間接的な指示の関係である間接照応(「麻生首相」と「夫人」など)があり,さらに文章外のモノやコトと照応関係にある外界照応がある.したがって照応解析では,照応詞の指し先を同定する先行詞同定に加えて,照応詞が直接照応か間接照応か,または外界照応なのかを分類する照応範疇分類の2つの処理を行う必要がある.しかしながら,先行研究では直接照応と間接照応がそれぞれ独立に研究され,照応範疇についてはほとんど論じられていないため,これら2つの処理をどのようにモデル化するかは自明ではない.具体的には,(i) どのように先行詞同定モデルを作成するか,(ii)どのような情報が照応範疇の分類に有効か,(iii)先行詞同定モデルと照応範疇分類モデルはどのように組み合わせられるべきか,明らかになっていない.

そこで本稿では,日本語文章内の「指示連体詞(この,その,あの)+名詞」の形の照応詞を対象として,これら3つの問題について調査を行った.調査の結果,(i)直接照応と間接照応で別々の手がかりを用いて先行詞同定モデルを作成すべきであること,(ii)先行詞同定モデルによって同定された最尤先行詞候補の情報が照応範疇分類に役立つこと,(iii)先行詞同定モデルにより先に最尤先行詞を選択し,その出力を照応範疇分類モデルの入力とする構成が有効であることがわかった.