地上撮影動画を対象としたVisual SLAMにおける航空写真を用いた蓄積誤差の軽減

宮本 拓弥 (1451105)


拡張現実感システムやロボットナビゲーションシステムでの利用を想定し,カメラの位置姿勢と3次元環境をリアルタイムに推定する手法として,Visual SLAM (Simultaneous Localization and Mapping)に関する研究が近年盛んに行われている. 一般的に,Visual SLAMには広範囲で長時間動作させると誤差が蓄積するという問題が存在する. これに対して,従来から一度撮影した地点を再度観測した際に,これまでに観測した3次元環境の情報からカメラ位置姿勢を補正するループクロージングと呼ばれる手法による蓄積誤差の解消法が提案されているが, 同一環境を2回以上観測しない場合には適用することができないという問題がある.

このため,GPS,3次元モデル,航空写真といった外部指標を用いたカメラ位置姿勢推定手法が提案されている. しかし,GPSを用いる手法では,GPSの測位精度の信頼度が低い場合にカメラ位置姿勢の推定精度が大きく低下する問題および,GPSの測位結果が長時間取得できない区間において,GPSの測位情報を推定結果に反映することが難しいという問題がある. 3次元モデルを用いた手法では,広範囲な屋外環境における3次元モデルの作成やデータベースの構築にかかる人的コストが大きいという問題がある. 航空写真を用いる手法では,既に構築されている航空写真データベースから航空写真を容易に入手できるため, 3次元モデルを用いる場合に比べて,環境を新たに計測する必要がないという利点がある. しかし,従来手法は動画像全体を対象とした一括での最適化を行うことを想定しており,Visual SLAMのようにオンライン処理で逐次出力が要求されるアプリケーションに適用することは困難である.

これらの問題点を踏まえ,本研究では,特徴点ベースでカメラ位置姿勢と3次元環境を推定するVisual SLAMを基軸とし, 地上から撮影された動画像と航空写真の対応付けにエッジ情報を利用することでオンライン処理と蓄積誤差の軽減を両立させるカメラの位置姿勢推定手法を提案する. 具体的には,地上から撮影された動画像と航空写真の見えを同じにするために,Visual SLAMで推定された3次元点群から地面を検出し,地上から撮影された動画像の各キーフレームを上空視点画像に変換する. 次に,上空視点画像と航空写真を対応付けるために,上空視点画像と航空写真から検出したエッジの距離が最小になるように位置合わせする. 最後に,カメラ位置姿勢の蓄積誤差を抑制するために,拡張バンドル調整により地上撮影画像と航空写真の双方に対する特徴点およびエッジ点の再投影誤差を最小化することでカメラ位置姿勢を修正する.

本発表では,提案手法の位置づけと手法の処理概要,動画像を入力した際の従来手法との比較結果と結果に対する考察,今後の予定について報告する.