並列多重文脈自由言語の効率のよい認識法

新居英紀 (9651084)


自然言語の構文を記述するのに文脈自由文法 (CFG) では能力が不足している と言われている. そこで CFG の拡張として並列多重文脈自由文法 (PMCFG) が 提案されている. PMCFG は生成能力が CFG より真に大きく, respectively 構 文や倒置文のような互いに割り込んだ構文を簡単に記述できる. PMCFG G に対して, G の認識問題を解く既知の最速アルゴリズムの時 間計算量はO(ne+1) である(n:入力系列長). ここで e は G のみに依存して決まる定数で, G の自由度と呼 ばれる.

これに対し, 本論文では論理行列の積を利用した O(ne'-3i'+1M(ni')) 時間の アルゴリズムを提案する. ここで, e', i'G のみに依 存して決まる定数であり, e'≦ e, i'≧ 0 を満たす. そして M(k)k×k 論理行列の積を求めるのに要する時間である. M(k) の値として O(k2.376) の値が知られているので, e'=e, i=0 の場合を除いて, 本アルゴリズムの時間計算量は既知のものよりも小さい. また, PMCFG を拡張した, 拡張並列多重文脈自由文法(E-PMCFG)を提案した. その生成能力は PMCFG より大きく, 文脈規定文法(CSG)より小さい. そして, E-PMCFG G に対して, G の認識問題を解く, O(n2m(e-1)+1) 時間の 認識アルゴリズムを提案した. ここで, e, mG のみに依存 して決まる定数である.