<HEAD> <TITLE>NAIST-IS-MT0651120: Junichi Maruyama</TITLE> </HEAD> <BODY bgcolor=ffffff> <H2>強化学習を用いたステッピングによる転倒回避動作の学習</H2> <H2>丸山 淳一 (0651120)</H2> <HR> 本研究では外乱による転倒を回避するためのステップ動作をヒューマノイドロボットによって獲得することを目的とする. ステップ動作生成に関する従来手法ではロボットの重心とZero Moment Pointを予め計画された軌道に 追従するよう制御することで実現しているが,転倒回避のためのステップ動作は与えられる外乱に依存するため 予め軌道計画することは困難である.そのため,本研究ではロボットや環境の詳細な動力学モデルを用いず, 自律的に運動タスクを学習・獲得することが可能な強化学習を用いた手法を提案する.転倒回避動作を 学習する際には,ヒューマノイドロボットの重心ダイナミクスを単純な倒立振子モデルに従うよう 制御器を構築し,状態行動空間を低次元で定義することで比較的少ない試行回数で目標動作を獲得する. 本提案手法の有効性は数値シミュレーションにより示す. <p> <HR> </BODY>