ミーティングの定量的評価・支援に向けたウェアラブルセンサおよび動画によるマイクロ行動の認識手法

曽根田悠介


近年では,働き方改革やアクティブラーニングと叫ばれるように少人数でのコミュニケーション能力の向上が注目されている.先行研究ではミーティングの振り返りの支援を目的とし,発言内容を解析を行い自動で会議の内容を要約する研究が複数報告されている.しかし,人対人のコミュニケーションに着目し,円滑なコミュニケーションを行う上で重要とされている頷きや視線の動かしといったマイクロ行動から,ミーティングの定量的評価や参加者への支援を行うといった研究は報告されていない.

本発表では,ミーティングの定量的評価および支援を目的とし,ミーティング中に発生する頷きといった頭部に発生するマイクロ行動を動画から認識する手法を提案する. 動画は360度カメラを円卓の中央に設置し撮影したものを使用する. 動画からは「Talk(発言)」「Nodding(頷き)」の2つのマイクロ行動の認識を行なった.

認識に用いるためのデータセットを作成するために,1度につき4名の被験者が5分間のミーティングを行い,ミーティングの満足度や関するアンケートへの回答と自身のマイクロ行動についてラベリングを行った. 合計で16回分のミーティングのデータを収集した

このデータセットを用いて,動画から機械学習(Random Forest)によるマイクロ行動の認識を行なった. このとき,スライディングウィンドウ法を用いデータの抽出を行い,行動変化点を含むウィンドウのデータは使用しないものとした. 5-分割法による認識結果のF値は「Idle(何もしていない)」は69.4%,「Talk」は69.5%,「Nodding」は62.9%であった.

次に,実際のミーティングに対してマイクロ行動の認識を行うことを想定し,動画から行動変化点を含むスライディングウィンドウを考慮した認識を行なった. 本実験のようなマイクロ行動では,センサデータから行動変化点を検出を行うのは困難である. したがって,スライディングウィンドウのなかで最も多い行動ラベルをそのウィンドウの正解ラベルと再定義しデータの抽出を再度行なった. 特に,Noddingは継続時間が短く発生回数も他のマイクロ行動より少ないため,サンプル数が他のマイクロ行動よりも極端に少なく精度の悪い機械学習モデルが生成された. そこで,アンダーサンプリングによるバランシングとオーバーサンプリングによるバランシングの2通りの手法により不均衡状態を解消し,マイクロ行動の予測モデルを生成した. その結果,アンダーサンプリングによる手法よりオーバーサンプリングによるバランシングの方がより精度の高い予測モデルを生成することができた. 最後に,TalkとNoddingを同時に予測することによって,誤認識が減少しミーティング動画からマイクロ行動の認識が概ね可能になったことを確認した.