行動の意図を推定する見まね学習
ATR連携講座
我々は他者の行動を見まねる事で共有の価値観を獲得できる.
そして共通の価値観を持つことで円滑なコミュニケーションが可能となる.
つまり「他者の行動を見まねる」という事がコミュニケーションを実現する上で
必要不可欠なものであると考えられる.
しかし自分と他者の持つダイナミクスは一般に異なるため,
他者の行動を見まねることは容易ではない.
例えば赤ちゃんが親の動きをまねようとした場合,
手足の長さや重さが異なるため自分の体に合った制御出力を行う必要がある.
そこで我々は他者の行動を観測し,
その裏に隠れた「行動の意図」を推定するアルゴリズムの開発を行った.
推定された行動の意図を実現する様な制御を行うことで,
自分の体に合った行動出力を行える.
例としてcart-poleの振り上げの見まねをシミュレートした.
図1が教示者の教示例で,図2が見まね学習者が教示者を観測することにより獲得した行動即に従って
振り上げを行った結果である.
両者のダイナミクスには大きな違いがあるが,
行動の意図を推定する見まね手法により,
見まね学習者は自身のダイナミクスに合った行動則を獲得できている.