振動子駆動型力学システムの強化学習

中村 泰 (9951084)


生物の歩行等の運動は、周期的な信号を発生させる中心的パターン生成器 と呼ばれる神経系によって制御されていると言われている。 本報告では、 中心的パターン生成器によって駆動される 物理システムの制御の獲得に強化学習法を用いる手法を提案する。 提案する手法では、中心的パターン生成器として神経振動子ネットワークを 用いる。 また、神経振動子ネットワークと物理システムを 全体として一つの力学システムとみなすことで 強化学習法を適用する。 強化学習法にはactor-critic アーキテクチャを用いる。 Actor およびcritic には関数近似器を用い、 critic の学習にはオンライン型の統計的学習を用いる。 本手法によって、神経振動子を用いた物理システムの制御が 学習できることを 計算機シミュレーションによって示す。