強化学習を用いた多様な環境における歩容獲得手法の実機蜘蛛型ロボットにおける検証

大下 将宗 (1251022)


近年,ロボット技術の発展から様々な分野で多脚ロボットが登場し,注目されている. この多脚ロボットは脚の多さから安定性が高いため,一般家庭や災害現場,山岳地帯,深海など幅広い環境での活躍が期待されている. 多脚ロボットの不整地における踏破能力の向上が研究されているが,現実の不整地の多様性を扱えるほどスケーラビリティを持った手法はいまだ開発されていない. ロボットが幅広い環境に適応するためには,開発者が事前にプログラムした行動だけでなく,自律的に環境に適した行動を生成できる学習能力が不可欠である. ロボットが置かれる環境を開発者が完全に把握することは多くの場合困難であるため,環境のモデルなしでも行動を習できる強化学習手法が研究されており,ロボットの行動獲得への応用も進んでいる. 研究目的としては,実機の蜘蛛型ロボットの不整地での踏破能力の獲得のため,不整地の多様性に合わせて保持している歩容群を適応的に増加させる手法の確立を目指す. 本研究では,学習戦略フュージョンという手法を用いて,実機の蜘蛛型ロボットの不整地における匍匐動作の獲得を行った.

In these years, many researchers are studying multi-legged robots. Since such robots have many legs, they can walk in stable; thus, they are expected to work in rough terrain. Therefore improvement of the ability for multi-legged robots to walk in rough terrain is studied. However, a walking method in rough terrain has not been developed yet. It is necessary to learn behaviors so that robots are adapted to various terrain. In this research, we aim to design a method to learn a walking policy for actual spider robot in varying rough terrain. Using the learning strategy fusion method, we acquire the walking policy where an actual spider robot learns walking task in various terrain.