遷移ベースの依存構造解析による英語前置詞の自動誤り訂正

光瀬 智哉 (1251041)


誤り検出・訂正は, 文書中に出現する単語の綴りの誤りや用法の誤りなど, 様々 な種類の誤りを計算機上で自動で検出・訂正するタスクである. 特に, 英語学習者 作文には, 様々な種類の誤りが数多く含まれており, それらの検出・訂正が一つの 課題となっている. 中でも前置詞は, 意味的に類似した文脈での使い分けの困難さ から, 学習者作文において高頻度で出現する誤りの一つである. 前置詞誤り検出・訂正は, 多クラス分類問題としての定式化が主流である. これ は, 個々の訂正候補の前置詞を一つのクラスとみなし, 訂正箇所の前置詞周辺の文 脈を適切な前置詞のクラスへと分類するものである. 前置詞誤り検出の分類器で, 素性に依存構造由来の素性を利用した Tetreault, Foster, and Chodorow (2010) 以来, Dahlmeier, Ng, and Ng (2012) のように, 前置詞誤り訂正でも依存構造由来の素性 を利用する手法も現れた. しかしながら, これまでの分類の基づく手法では, 訂正 前後で前置詞の依存先の変化が考慮されてこなかった. そのような場合, 訂正後の 前置詞の本来の依存先の情報が最大限活用されていない. 本研究では依存解析の 際中に前置詞誤り訂正をおこなう手法を提案する. これにより訂正前後の係り受 け先の変化を考慮を可能にする.