振動子駆動型力学システムの強化学習
中村 泰 (9951084)
生物の歩行等の運動は、周期的な信号を発生させる中心的パターン生成器
と呼ばれる神経系によって制御されていると言われている。
本報告では、
中心的パターン生成器によって駆動される
物理システムの制御の獲得に強化学習法を用いる手法を提案する。
提案する手法では、中心的パターン生成器として神経振動子ネットワークを
用いる。
また、神経振動子ネットワークと物理システムを
全体として一つの力学システムとみなすことで
強化学習法を適用する。
強化学習法にはactor-critic アーキテクチャを用いる。
Actor およびcritic には関数近似器を用い、
critic の学習にはオンライン型の統計的学習を用いる。
本手法によって、神経振動子を用いた物理システムの制御が
学習できることを
計算機シミュレーションによって示す。