NAIST-IS-MT0451100: Hitomi Kentarou

方策勾配法による準受動歩行制御の学習

人見謙太郎 (0451100)

受動歩行はエネルギー効率のよい歩行ロボットの開発や人間の歩行の理解の鍵として注目されている．受動歩行は初期条件や外乱に対して敏感なため，これを克服するために補助的な制御を施す準受動歩行の研究が行われている．本研究では準受動歩行のための強化学習法の開発を目的とし，膝のある不安定なロボットモデルを用いてシミュレーション実験を行った．ロボットの準受動歩行と人間の歩行の両方の研究をふまえて，制御器は歩行中に間欠的に矩形波状のトルク入力をするだけのシンプルなものを用い，また歩行運動を歩き始めの初期相とその後の維持相に分割して維持相の制御を学習することにした．強化学習で用いる報酬関数は目標軌道を必要とせず，ロボットの受動性をできるだけ利用してロボットと環境からなる系に適した歩行軌道を生成するように設計した．シミュレーション実験によって，ロボットが歩行できない状態から学習を開始して $500$ エピソードの学習により定常歩行のための制御器が獲得できたことを示した．また獲得された制御器はある程度外乱に対してロバストであることを示した．

方策勾配法による準受動歩行制御の学習

人見 謙太郎 (0451100)

人見謙太郎 (0451100)