MOSAICの確率モデル

大佐賀 智(0551023)


ヒトは多種多様の不確かな環境下で正確かつ適切な運動制御を 行うことができる.MOSAIC (MOdular Sellection And Identification for Control)はそのようなヒトの能力を説明するモデルとして提唱された. しかしMOSAICは学習則などにヒューリスティクスが含んでおり, 見通しの良くないモデルとなっていた.

本論文では, MOSAICを混合正規分布を用いた確率モデルで再定式化(p-MOSAIC)し, その学習則を オンラインEMアルゴリズムから導出する.p-MOSAICの学習則をMOSAICの ものと比較し,主に制御器学習に相違が見られることを除けば両者は 良く対応していることを示す.最後に人工データを用いたシミュレーション を行い,MOSAICと比べてp-MOSAICの学習則が責任信号の推定を安定化すること, ノイズのある環境下で正確な制御と安定な学習を実現することを示す.

発表ではまずMOSAICとp-MOSAICの大まかな描像を, 特に両者の学習則の類似点と相違点に着目しながら説明する. 次に比較実験として行ったシミュレーションを紹介し, MOSAICとp-MOSAICそれぞれの結果から両者の学習則を評価する. 最後にこれからの展望として,機械学習の一分野である強化学習の 手法をMOSAICの学習に応用し,学習の効率化を計るアプローチを 紹介する.