マイマップをクエリとして用いた類似マイマップ検索システムの提案と実装

金平 卓也 (1551034)


本研究では,ユーザが独自に地理情報(POI:Point of Interest) を地図にまとめた様々なマイマップの中から,自分の目的に合致したマイマップを探しやすくする新しい検索手法の提案と実装を行う. マイマップはユーザが自由に作成しており,検索サービスから得られる各マップには適切かつ十分なメタ情報が含まれていないという欠点がある. そのため,通常のフリーキーワードによる検索では,目的のマップを見つけることが困難な状況にある. この問題に対して,本研究では2つのPOI情報の補完手法とマイマップによる類似マイマップ検索システムを提案する. マイマップに登録されているPOIがどのようなジャンルの場所であるかを示すカテゴリ情報を補完することにより,ユーザが求めるカテゴリのPOIを登録したマイマップを見つけることが容易になると考えられる.

提案するPOI情報の補完手法の1つはPOI同定法であり,これはマイマップに登録されているPOIの位置情報や名称を元に,物理的距離とレーベンシュタイン距離を用いてPOIデータベースから該当するPOIを同定することにより情報補完を行う. このPOI同定法を用いた情報補完がどれくらいの精度で行えるか確認するためにPOI同定精度の評価実験を行った. その結果,4万6999件中2万7645件を同定することができ,同定精度は58.82%であることが分かった.

次に,もう1つの提案するPOI情報補完手法はPOIカテゴリ推定法であり,これはFoursquareのPOIデータベースにあるPOIの名称とカテゴリの関係をサポートベクター回帰(SVR)ベースで機械学習を行い,マイマップに登録されているPOIの名称からカテゴリを推定することにより情報補完を行う. カテゴリ推定のため,機械学習する際の特徴抽出方法を4つ(origin,unigram,mecab,hybrid)提案し,それぞれの推定精度を比較する. このPOIカテゴリ推定法の評価実験の結果,最も推定精度が高い特徴抽出方法はhybridであり,25種類のカテゴリを平均70.3%で推定できることを確認した.

最後に,提案する類似マイマップ検索システムでは,補完されたPOI情報の中でもカテゴリに着目し,マイマップ毎にカテゴリベクトルという特徴量を定義する. 提案システムでは,キーワードではなく,ユーザが過去に作成したマイマップを入力とし,そのカテゴリベクトルを他の膨大なマイマップと比較し,それらの類似度に基づき,類似マイマップを提示する. そして,提案システムのプロトタイプを実装し,類似マイマップが提供できるか被験者10人にアンケート評価を行った. その結果,提案システムは任意のマイマップを入力するとそのマイマップに類似したマイマップを提示することが可能であることがわかった. また,類似したマイマップであると提示するカテゴリベクトルのコサイン類似度の閾値は75%程度であることが分かった.