Web検索スキルの共有に向けた検索履歴データからの知識抽出

永野 一馬 (1751082)


今日インターネット上の情報量が爆発的に増加し、人々に膨大な情報から必要な情報を探し出すWeb検索スキルが求められている。 先行研究でもWeb検索スキルは実世界の労働能力、学習能力とも大きく関係していることが報告されており、 これまで以上に重要な能力となっている 一方で、Web検索スキルは一般に共有されない暗黙知となっており、自身の検索プロセスを振り返る機会も少ない。 現在、自身の検索を振り返るツールとしては一般に、ブラウザの検索履歴が利用されている。 ブラウザの検索履歴には、WebページのURL、タイトル、アクセス日時が時系列順に保存されており、 後から自身で振り返ることで、ある程度検索当時の思考プロセスを振り返ることができる。 しかし、ユーザの閲覧ページ数は日に1000件以上に及ぶ場合もあり、 全ての閲覧から目的のページを探し出すことは非常に困難であり、他者との共有にも不向きである。 また、検索履歴のみでは、情報が少なく、閲覧理由を思い出すことのできないWebページも多い。

本論文では、Web検索時の思考プロセスを記録するため、閲覧履歴に加え、独自にページの閲覧されたコンテンツの割合をはじめとした、 ユーザの検索行動を記録することのできるロギングシステムを提案・実装する。 ブラウザの標準機能をはじめ、多くの閲覧履歴に関するアプリケーションでは、ページの訪問日時、回数のみを用いており、 ユーザ自身が検索時の思考プロセスを省みることや、他者がWeb検索スキルを向上させる目的で利用するには、情報が少なかった。 開発したロギングシステムでは、一連の情報検索中のユーザのスクロール、クリックといったページ内の行動だけでなく、 ブラウザに対するブックマーキング、タブ操作といった、暗黙知である行動を包括的に記録することができる。 さらに、ページ閲覧時のユーザの表示領域閲覧率(Viewport時間)を計測することで、ユーザがどの程度コンテンツを閲覧したかをシステムが理解することができる。

また、開発したロギングシステムを用いて、検索課題中のユーザの検索行動を記録する実験を行い、得られたデータから、抽出可能なユーザのWeb検索時の思考を検討した。 そして、得られた結果から、検索課題中に、ユーザが重要だと感じたページを86\%の精度で抽出できることを確認した。 さらに、開発したシステムを用いて、検索履歴データから、ユーザの思考プロセスを反映した知識を抽出し、 可視化することを目的としたWebアプリケーションを提案・実装する。 Webアプリケーション上では、履歴数の膨大さを考慮し、ページの重要度に応じて、閲覧履歴が強調、フィルタリングされる。 また、検索クエリ、ページの特徴語を合わせて表示することで、検索時の思考を知識として読み取ることが可能な状態に要約し、表示される。

最後に、提案アプリケーションのユーザビリティ調査を行い、「提案アプリケーションから得られた知識が検索課題に役立ちましたか?」という質問を行い、 80\%のユーザから肯定的な評価を得た。 一方で、「検索履歴を他者に公開することに抵抗がある」、「知識を逐一公開するのが面倒に感じる」といった項目の回答は、ユーザによってばらつきがあり、 カスタマイズ性を向上させる必要があることがわかった。