題目:複数台ロボットの協調作業のための階層型行動生成

平野 雅敏 (9851090)


最近、これまでのロボット研究の成果により、本田技研やSonyなどが自律型 ロボットを開発するなど、人が指示を与えなくても自分で判断して行動する ロボットが出現している.よって近い将来、人間にとって危険な場所などに代わりに ロボットに作業をさせるということが可能になると考えられる.また、 そのようになると作業内容によっては複数台のロボットを協調させながら行なう 必要があると考えられる.しかし、複数台のロボットを制御しようとすると 状態が複雑になってしまうので単純なアルゴリズムをロボットに組み込む方法 ではたとえ上手くいったとしても無駄な行動が多くなる.また、全ての 状態について、一台一台の行動を決めるような方法は不可能である.

そこで強化学習を用いて協調作業を獲得するといった研究が最近多くなされて いる.強化学習を用いる利点は環境が複雑であってもロボットが試行錯誤 することにより、最適な行動を獲得できる事である.しかし、従来の研究では行 動として前進・後退・回転など簡単な行動しか出力していない.これは強化学習の 出力が離散的なためロボットの移動速度などを出力する事が不可能だからである. そのため、そのような行動出力ではゴミ拾いなどの単純なタスクでは十分である かも知れないが、ロボットサッカーのようなパス・シュートなど複雑な動きが 要求されるタスクでは不十分であると考えられる.

本研究では強化学習の出力を従来研究のような簡単な行動ではなくシュー ト・パス・移動など抽象的な行動とし、その行動と状態により行動を達成するた めの速度を出力するという階層型の行動生成を提案する.本手法を用いる事によ り複雑な環境でも最適な行動が獲得できる強化学習の長所を残しつつ、移動速度 を最終的に出力できるため、細かい動きをロボットに行なわせる事が可能となっ ている.