文法誤り訂正は言語教育への自然言語処理技術の応用先として最も注目されているタスクの一つである.中でも日本人英語学習者が共通して間違いやすい文法項目として,日本語には存在しない「前置詞」が挙げられる.実際,日本人大学生によって書かれた英作文からなる学習者コーパス,Konan-JIEMコーパスにおいて前置詞誤りは3番目に多い誤りであり,文法全体の約14%を占めている.
前置詞誤り訂正は,多クラス分類問題としての定式化が主流である.これは,個々の訂正候補の前置詞を一つのクラスとしてみなし,訂正箇所の前置詞周辺の文脈を適切な前置詞のクラスへと分類するものである.前置詞がもつ多義性によって,表層上では同じ前置詞でも文脈に依存して多様な潜在的な意味関係を表現することがある.例えば,英文 I stay in New Yorkと We met in 1985 における下線部のinは表層上では同じでも,それぞれ「場所」,「時」のような異なった潜在的な意味関係を表現している.表層上は同じだが潜在意味関係が異なる場合,当然各意味関係ごとに出てくる文脈が異なることが予想される.しかし,既存手法では前置詞の潜在潜在意味関係を考慮せず前置詞の表層情報のみを扱っている.
本研究では,まずはじめに前置詞とその潜在的意味関係の同時解析手法を提案し,前置詞予測タスクにおける前置詞の意味的曖昧性の影響について分析する.次に,前置詞の潜在意味関係情報を前置詞誤り訂正を行う際の新たな素性として利用するために2つのモデルを提案する.そして文法誤り訂正タスクの評価セットを用いた評価実験により,本手法が,既存の潜在意味関係情報を用いない手法と比べて高い精度となることを示す.最後に,言語教育への応用という観点から潜在意味関係を考慮することの必要性について言及する.