スケール不変特徴量を用いたランドマークデータベースに基づく静止画像からのカメラ位置・姿勢推定
薄 充孝 (0551072)
携帯電話におけるヒューマンナビゲーションは,二次元的な地図上にGPSによって得られるユーザ位置と経路情報を表示することで道案内を実現している.
しかし,二次元地図と現実空間の対応関係を直感的に把握することが難しく,システムの案内に従って移動することは必ずしも容易ではない.
この問題を解決するために,現実環境を撮影した画像に対してナビゲーション情報を重畳表示することで,利用者に直感的な案内情報を提供する拡張現実感技術(Augmented Reality; AR)に関する研究が近年盛んに行われている.
案内情報を幾何学的に正しい位置に重畳表示させるためには,カメラの正確な絶対位置・姿勢を推定することが必要となる.
従来,携帯機器によるARを用いたヒューマンナビゲーションを想定したシステムはいくつか提案されているが,カメラ位置・姿勢の推定精度が十分でなかったり,動画像による入力を前提としているために携帯機器での処理には計算コストが大きすぎるという問題があった.
これらの問題を解決するために,ランドマークデータベースを用いた静止画像からのカメラ位置・姿勢推定手法が提案されている.
この手法では,世界座標における三次元位置と見え方が既知の複数のランドマークを入力画像中から探索することでカメラの位置・姿勢を6自由度で推定できる.
しかし,画像のスケール変化に対応していないため,ランドマークデータベース構築時の撮影経路から大きく離れた地点では推定が失敗するという問題があった.
そこで本研究では,この手法を基礎として,スケール不変特徴量を用いた拡張を行うことで推定のロバスト性を向上させる.
提案手法ではまず,画像の局所構造に依存する特徴点ごとの固有スケールを算出する.次に,この固有スケールを用いることで撮影距離に依存しないスケール不変特徴量を生成し,これを用いて入力画像中の特徴点とランドマークを対応付ける.さらに,カメラ位置・姿勢候補を特徴点の固有スケールを用いた投票により決定することで,誤対応の排除を行う.これにより,本手法では,データベース撮影経路から離れた地点で撮影された画像を入力として用いた場合にもカメラ位置・姿勢を推定することが可能となる.
本発表では,特徴点の固有スケール算出処理と固有スケールを用いた投票処理について重点的に述べ,さらに,屋外環境で行った実験結果からデータベース構築時カメラパスからの入力画像撮影地点の距離とカメラ位置・姿勢推定制度の関係を従来手法と比較することで,提案手法の有効性を示す.