チャンクに基づいた逐次型統合解析

小比田 涼介(1651047)


逐次処理は音声処理や対話システムなど、入力を漸進的に処理する場合に必要とされ、システムの素早い反応や自然な振る舞いの達成に不可欠な技術である. 係り受け解析に関しては、遷移型の解析器により逐次解析が提案されてきたが、実テキストを入力とし、形態素解析及び係り受け解析の双方を逐次的に実行する手法に関しては未だ議論が十分になされているとは言い難い. 本論では連続する語の塊(チャンク)に基づいた逐次型統合解析手法を提案する. こちらの手法は、文字を入力として、単語分割・形態素解析・係り受け解析を入力順に貪欲に推定していくアルゴリズムである. 実験においては、限られた情報のみを使っているにもかかわらず、従来の非逐次型の解析器に劣らない精度を達成した. 考察では、逐次型統合解析における困難点や有効素性について分析し、また、本手法の他言語拡張についても議論する. 今後の課題としては、音声認識結果を入力とするなど、より実践的な場面における検証がある.