遅延フィードバック制御器を含む準受動二足歩行制御器の強化学習

橋崎 知 (0651095)


2足歩行ロボットの歩行様式として動力を一切持たないロボットが自身の構造
や重力,環境との相互作用を利用し,人間に近い自然な歩容を示す受動歩行が知られている.
受動歩行に補助的な制御を与え平地での歩行を実現する準受動歩行は,
自然な歩容と優れたエネルギー効率を実現する歩行制御則として注目を集めている.
しかし,身体の物理パラメータや環境の変化に敏感であるため,
制御パラメータの自動調節が望まれる.この問題に対し,
環境適応型学習である強化学習を準受動二足歩行制御に適用し,
その有効性を示した先行研究が数例存在するが,外乱に対する安定性が低い問題があった.

本研究は,受動歩行の安定化に効果的であると考えられる遅延フィードバック制御器を含む
準受動二足歩行制御器を提案し,強化学習法による歩行安定性とエネルギー効率を
両立する制御器の適応的獲得を目的とする.確率的に外乱の大きさと
向きが変動する環境下で学習を行い,提案手法の有効性をシミュレーション実験により示す.