係り受け情報を利用した日本語形態素解析

俵 雄貴 (1351067)


形態素解析は分かち書きされていない文を単語に区切り,品詞を付与し, 正規形を同定する処理である. 現在までに様々な形態素解析手法が提案されており,形態素解析の精度は高い水準に達している. その一方で既存の手法では上手く解析できない事例が報告されている. 本研究では,そういった事例に対して係り受けの情報を用いることにより解決を試みる. しかし,係り受けの情報を使うためには少なくとも文が単語に区切られている必要があり, 形態素解析の段階で係り受けの情報を利用することは困難である. そこで本研究では形態素解析と係り受け解析を同時に行うことにより, 係り受けの情報を形態素解析に利用する. 同時解析では,形態素ラティスに対してCYKアルゴリズムを適用し, 形態素の並びのスコアと係り受けのスコアの2つのスコアを考慮することにより解析を行う.