ランドマークデータベースを用いた投票に基づく 静止画像からのカメラ位置・姿勢推定

中川知香 (0451083)


近年,携帯電話によるヒューマンナビゲーションシステムなどの位置依存情報を利用したサービスが実用化されている.一般的に広く普及しているナビゲーションシステムは,携帯電話に内蔵されているGPS から取得した位置情報を用いて2 次元的な地図上での道案内を実現している.しかし,これらのシステムでは,複雑な交差点等で地図と現実の交差点の関係を正しく把握することが難しく,システムの案内に正しく従って移動することは必ずしも容易ではない.

このような問題を解決するために,現実環境を撮影した画像に対してナビゲーション情報などを表す仮想物体を重畳表示することで,利用者に直感的な案内情報を提供する拡張現実感技術(Augmented Reality; AR)の研究が近年盛んに行われている. ビデオシースルー型ARでは,仮想物体を幾何学的に正しい位置に重畳表示するために,カメラの正確な絶対位置・姿勢情報が必要である. PCよりも計算能力が劣る反面どこにでも持ち運べる携帯端末上では,多数のセンサを用いることやリアルタイムで動画像を処理することが難しく,また広域環境に対応させる必要があるために,従来のカメラ位置・姿勢推定手法をそのまま利用することは難しい.

本研究では,特徴点追跡に基づく三次元復元によって事前に得られる自然特徴点の三次元位置と撮影地点ごとの画像情報をランドマークとして登録した広域環境の自然特徴点ランドマークデータベースを用い,市販されているカメラ付き携帯端末でも容易に取得可能な1枚の静止画像からのカメラ位置・姿勢推定手法を提案する. 提案手法では,まず入力画像内の特徴点と類似度が高いランドマークを1対多で対応付け,各ランドマークと同じ見え方で撮影できる領域に投票することにより入力画像が撮影された可能性が高いカメラ位置候補を特定し,ランドマークと入力画像の特徴点の誤対応を排除する. 次に,カメラ位置候補に投票したランドマークと入力画像の特徴点の組を複数用いて,カメラの位置・姿勢を推定する. 実験では,屋外・屋内環境のランドマークデータベースを構築し,屋外・屋内で撮影された画像からのカメラ位置・姿勢推定実験を通して提案手法の有効性を検証する.