文書情報の可視化による絞り込み支援

林 一成(9851087)


近年,大量の文書データベース中からの文書検索のための研究が数多く行われ ている. 最も古典的な方法であるキーワード型検索方法は,与えられたキーワードに対 して,そのキーワードを含む文書の一覧を表示する検索方法である. ユーザは欲しい文書集合を得るために論理式を書く必要があるが,検索結果の 文書集合が膨大になり不要な文書が多数含まれたり,絞り込みすぎて欲しい文 書を見つけられないことがある. 検索精度のよい論理式を書くためには, 検索対象に対する専門的な知識や検索式を書く技術が必要となり, 一般のユーザにとっては難しい. 結果として,ユーザが大きな文書集合から個々に内容を確認していくこと が必要となり,非常に手間がかかる. そこで,本研究では文書情報の可視化による絞り込み支援法を提案する. 特定の文書を特徴づける単語をキーワード候補語を提示し,その候補語による 検索結果の件数分布の全体図を可視化する. この可視化結果から,ユーザは自分の興味ある文書やキーワード候補語からの 検索が容易になり,かつその検索結果の件数が分かる. これにより,キーワード検索で検索上位にあがらなったユーザが欲しい文書を 発見することが可能になる. またキーワード候補語を用いることにより,ユーザの検索概念に即しているが 思いつかなかったキーワードを提示できる. これにより,絞り込みに掛かる手間を減少させることが可能になる.