文書情報の可視化による絞り込み支援
林 一成(9851087)
近年,大量の文書データベース中からの文書検索のための研究が数多く行われ
ている.
最も古典的な方法であるキーワード型検索方法は,与えられたキーワードに対
して,そのキーワードを含む文書の一覧を表示する検索方法である.
ユーザは欲しい文書集合を得るために論理式を書く必要があるが,検索結果の
文書集合が膨大になり不要な文書が多数含まれたり,絞り込みすぎて欲しい文
書を見つけられないことがある.
検索精度のよい論理式を書くためには,
検索対象に対する専門的な知識や検索式を書く技術が必要となり,
一般のユーザにとっては難しい.
結果として,ユーザが大きな文書集合から個々に内容を確認していくこと
が必要となり,非常に手間がかかる.
そこで,本研究では文書情報の可視化による絞り込み支援法を提案する.
特定の文書を特徴づける単語をキーワード候補語を提示し,その候補語による
検索結果の件数分布の全体図を可視化する.
この可視化結果から,ユーザは自分の興味ある文書やキーワード候補語からの
検索が容易になり,かつその検索結果の件数が分かる.
これにより,キーワード検索で検索上位にあがらなったユーザが欲しい文書を
発見することが可能になる.
またキーワード候補語を用いることにより,ユーザの検索概念に即しているが
思いつかなかったキーワードを提示できる.
これにより,絞り込みに掛かる手間を減少させることが可能になる.