NAIST日本語句構造文法の拡張とトレーサの実装

森本芳弘 (0151112)


言語学における文法の役割は、言語の文がどのような構造によって 構成され意味を表現するのかを明らかにすることである。

1980年代以前の自然言語処理システムはこの目的を達成するために 文脈自由文法を拡張したものを解析に利用していたが、 多数の規則を扱わければならず管理が繁雑になる問題があった。

PollardとSagが提案した主辞駆動句構造文法 (Head-driven Phrase Structure Grammar, HPSG)は この問題の反省からこれまで多数存在していた文法規則をスキーマと原理に分け、 語に依存した文法規則を文法知識として語に持たせることで、 個別の現象を説明する文法規則を不要にした。 そして素性名と値が対になった素性構造を用いて 統語的側面と意味的側面から言語現象を説明できる枠組を与えている。 しかし現状では、統語的な議論が中心であるため、意味については深く議論していない。

HPSGのように素性にもとづく理論では、文の解析が進むごとに素性構造が変化する。 よって文の解析過程を効率よく追跡するシステムが必要である。 発表では文が解析される過程を視覚化するトレーサについて述べる。 言語は日本語を対象とし、文法理論にはHPSGを拡張したNAIST日本語句構造文法 (NAIST Japanese Phrase Structure Grammar, NAIST JPSG)を採用した。

HPSGと同じく現在のNAIST JPSGにも統語情報に比べて 意味情報を詳細に記述できていない問題点がある。 そこでNAIST JPSGの意味情報を拡張するために生成語彙 (Generative Lexicon, GL) で 提案されている素性構造を導入する。 しかしNAIST JPSGとGLは語の表現に素性構造を用いているが それぞれの記述形式にずれがあるため、そのままの形でGLを統合することはできない。 そこでGLの素性構造にリスト表現を導入し、述語を素性構造で表現できるようにした。 そしてGLが持つ素性名の値に制限を加えるため、型階層を定義し 各素性名がとる値の範囲を制限した。 さらに既存のNAIST JPSGの原理では句が作られるときGLの素性構造を 句に伝えることができないため、新たにGL Principleを提案した。 この拡張によりNAIST JPSGにGLを統合できることを報告する。

トレーサにはトレースできる機能、単一化誤りを検出し通知する機能、 文の解析を制御できる機能、制約を緩和する機能が必要である。 トレーサはShift-Reduce Parsingの機構を利用して解析を進める。 解析中に単一化誤りが発生した場合、生成的演算と呼ばれる操作によって 制約を緩和し、以降の解析を可能にする。 生成的演算のうちタイプ強制は引数側のGL素性を全探索することで制約の緩和を行い、 共構成はQualia Unification、EVENTを変化させる処理、ARGSTRを変化させる処理で 制約を緩和する。 結果「音楽を楽しむ」や「ケーキを焼く」のような文が 生成的演算を利用して解析できることを報告する。