ユーザクラスタリングを用いた文書検索システム(DOCUSEUC)の提案

種田 良子 (0451202)


近年,企業や大学などのイントラネット上では,グループウェアと呼ばれるツールを利用した文書共有が行われている.文書共有はユーザが文書をサーバへアップロードする作業と,必要な文書をサーバからダウンロードする作業からなる. 現状では,ユーザは文書をダウンロードする際,膨大な数の文書中から,目的とする文書を選別する必要がある.ユーザによる文書の選別を容易にするため,検索システムには,より高い検索精度が求められている.

我々は,組織内において,ユーザが所有している文書は,ある特定の目的や興味の基に収集されたものであると考える.したがって,所有している文書間に存在する相関を基にして,目的や興味が類似したユーザのグループを構成することができると考える.構成したユーザのグループに基づき,検索対象とする文書をあらかじめ選別しておくことで,最終的に検索結果としてシステムから与えられる文書が,検索時に指定するキーワードの一致, 不一致だけでなく,ユーザの興味分野に即したものとなり,文書検索の性能を向上させることができると考える.

我々は,組織内を適用対象とした,ユーザクラスタリングを用いた検索システム, DOCUSEUCを提案し,ユーザクラスタリング手法を用いることによって,検索性能が向上することを確かめた.