並列構造の類似性・可換性に基づく並列句範囲の曖昧性解消

寺西 裕紀 (1651075)


並列構造解析の主たるタスクは複数の並列する句の範囲を同定することである.並列構造は文の構文・意味の解析において有用な特徴となるが,これまで決定的な解析手法が確立されておらず,現在の最高精度の構文解析器においても誤りを生じさせる主たる要因となっている.既存の並列句の範囲の曖昧性解消の手法は並列構造の類似性のみの特性や他の構文解析の結果に強く依存しているという問題があった.本研究では,近年自然言語解析に広く使用されているリカレントニューラルネットワークを用いて,構文解析の結果を用いずに単語の表層形と品詞情報のみから並列句の類似性と可換性の特徴ベクトルを計算し,並列構造の範囲を予測する手法を提案する.Penn TreebankとGENIAコーパスを用いた実験の結果,提案手法によって先行研究を上回る解析精度を得た