文書構造情報を利用したWeb情報検索に関する研究

伊藤智博 (0651011)


現在、検索エンジンによって作成される検索結果一覧は見易いとは言えず、この結果一覧に含まれる要約を見ても内容を理解できない物が多い。そのため得られた検索結果の中で検索対象の語がwebページ内のどこで使われているかをユーザ自身が確認し、ページの適合性を判断しなければならない。さらに、現在の検索エンジンを利用した情報検索において、対象とするwebページ内において複数の話題を取り扱っていることが多く、情報量が膨大である。これらを解決するために、我々は、webページを検索としての単位とするのではなくwebページ内の部分文書を検索としての単位とすることにより単位あたりの情報を絞ることが可能となり効率的な情報提示が可能ではないかと考えた。さらに、webページの文書構造情報を利用し、検索対象の語がページ内でどの部分に出現しているかをユーザに知らせるためのインタフェースを考えた。これらにより検索エンジンのユーザビリティの向上を図る手法を提案する。