複数の予測モデルを用いた運動系列の生成と認識
-非線形制御と運動パターンのシンボル化-

片桐 憲一 (9751031)


人間の行動学習においては、環境や扱う対象が様々に変化するなかで、未知の環 境への適応性の高さ、再適応の早さ等の特徴があげられる。このような特徴は人間の 脳内のモジュール構造の存在を示唆している。そこで本研究では、環境の局所 的なモデルと強化学習システムをペアとしたモジュールを環境の予測誤差の soft-max関数により適応的に切り替え、組み合わせる強化学習の方式につい て検討を行なう。「線形モデルと評価関数の学習による方法」と「線形モデルと 2次形式報酬モデルによる方法」の具体例として、制御対象に強い非線形性 を持つ単振子の振り上げの課題を行ない、非線形性をもつ 環境下において,タスクの分割が可能であり、さらに個々の分割されたタスクの 制御則を学習し、それらを切り替え・組合せることで制御が可能なことを示す。 さらにacrobotの振り上げの課題を行い、複雑な運動パターンのシンボル化を 示すとともに、運動系列の認識が可能であることを示す。