歩行者群の注視方向とシーン中の注視点の同時時系列最適化

小嶋翔太 (1451044)


注視,すなわち人が空間中の何に興味を持って見ているか,という情報は,広告の評価やロボットインタラクション,異常の発見といった,さまざまな分野で応用の利く情報である.近年普及が進んでいる監視カメラの映像から注視を推定する試みがなされている.しかしながら,監視カメラ映像のような,人が低解像度で映る映像から目の動きを観測することは困難なため,視線と同様に人の興味の指標である頭部方向の推定精度の向上が,注視推定の精度において最大の課題である.

本研究では,この頭部方向推定を,人が注視する対象の共通性という観点から最適化することを目指す.人が生活する空間には,複数人によって共通して注視されるもの(オブジェクトや位置)とそうでないものとが存在する.前者が存在する位置を推定することができれば,個人の注視点推定や頭部方向推定に有用であると考えられる.一方で,未知の「人によく注視されるオブジェクト」の位置を推定するために,既存の手法によって推定される頭部方向および集合視が利用できる.ここでは,集団視で各人の頭部方向と注視される位置との相互の関係を統合・推定することによって,注視点と頭部方向を同時最適化する方法を提案する.

発表では,既存の頭部方向推定や注視点推定の手法で達成できない課題について提起し,それを解決するためのアイデアや仮定を示す.また手法の評価として,提案手法を4500フレーム程度の長さの監視カメラ映像に適用し,頭部方向推定の誤差を12%減少させたほか,複数人に共通する注視点の検出が可能であったことを示す.