効率的な更新が可能な構造化文書索引に関する研究

金本博隆 (9651031)


本稿では効率的な更新が可能な構造化文書索引の提案を行う. 提案する索引は, 文書の論理構造から文書インスタンス中の文字列や要素の出現位置を求める構 造索引と, 文書の文字列や要素, 属性, 属性値から出現位置を求める内容索引 の二種類の索引から構成される. 大量の文書インスタンスに対応するため, 要 素や経路式から注目する要素や経路式を含む文書インスタンスを求める単純構 造索引を用いる.

問合せ能力,検索コスト,更新コストの観点から既存の索引と提案する索引と の比較を行い,それぞれの点で提案する索引の方が優位もしくは同等であるこ とを示す.

さらに提案する索引を実装するための枠組について議論する.