Japanese Dependency Structure Analysis Based on Support Vector Machines

工藤 拓 (9951036)


本稿では, Support Vector Machine (SVM)に基づく日本語係り受け解析手法を提 案し,その評価を行なう. 既に, 決定木や最大エントロピー法等が統計的係り受 け解析の学習モデルとして提案されているが, これらの手法は慎重な素性選択が 要求されたり, 素性の組み合わせを効率良く学習できないといった問題がある. その一方で, SVMは従来からある学習モデルと比較して,入力次元数に依存するこ となく極めて高い汎化能力を持ち, さらに Kernel 関数という概念を導入する ことで効率良く素性の組み合わせを考慮しながら学習することが可能である. 本稿では, SVM を係り受け解析に適用しその評価を行なう. その際, 任意の二文節間の係りやすさを数値化した行列を作成し, そこから 動的計画法を用いて文全体を最適にする係り受け関係を求めるという従来法に 基づく手法と, 直後の文節に係るか係らないかという観点のみで決定的に解析す る提案手法の二つの適用方法の比較を行なう.

本発表では, SVM の簡単な説明, 二つの適用方法の定性的, 定量的な違い, さら に京大コーパスを用いた実験結果を述べる.