CPG-Actor-Critic法によるミミズ型ロボットの適応的な推進運動の獲得

牧野 研司(0551112)


移動ロボットを開発する際に, ロボットのダイナミクスを含む環境の変化に対して どのように適応させるかということは非常に重要な課題である. 未知の環境に適応するための枠組みとして強化学習法がある. 多くの自由度を持つロボットは一般に様々な運動形態をとれるので, 高い環境適を持つことが期待できるが, その制御器の学習は困難である. 研究グループにおける前回の研究では, CPG-Actor-Critic手法と呼ぶ強化学習法を, コンピュータシミュレーションにおいて 冗長なミミズ型ロボットモデルに適用し, 自律的に蠕動運動を獲得させることに成功した. 本研究では, 実際にミミズ型ロボットを製作し, ロボットに本手法を用いて自律的に蠕動運動を獲得させることにした. その結果, ミミズ型ロボットは自律的に蠕動運動を獲得することに成功した. また, アクチュエータの一部が故障したと想定した状態からも学習を行い, 故障していないアクチュエータがその環境に適応することで, 前進運動を獲得することができた. これらの実験によりCPG-Actor-Critic手法が実環境に対しても有効であることを示した.