動的環境におけるエージェントの移動戦略

片桐 哲也 (9551021)


本研究では、動的な環境に対して頑健であるエージェントの移動戦略について、 様々な戦略を持つエージェントを計算機上でシミュレーションを行い、比較・ 考察する。シミュレーションにおいては、様々な実世界の制約を捨象し、格子 状の空間での迷路探索におけるエージェントの行動戦略のみに焦点を当てる。 タスクとしては、格子状空間における障害物を回避しながらのゴールへの経路 発見とし、下記のエージェントをそれぞれある環境下で学習させた後に、環境 を様々変化させ、それらに対する振る舞いの変化から、どのような戦略が動的 環境に対して頑健であるか評価する。

比較するエージェントは方向転換を行う際に、

  1. 記憶を持たずにランダムに方向を選択するタイプ
  2. 移動方向と視覚の局所的な情報をもとに反射的に決定するタイプ
  3. 過去に方向転換を行った回数(経験)に比例して方向を選択するタイプ
  4. 探索範囲を限定して深さ優先探索を行うタイプ
である。

シミュレーションによって、2)の反射的な戦略は、静的環境では短い経路を選 んだ。しかし、動的環境においてはその記憶が足かせになり、ゴール到達率は 極端に下がり、頑健性が損なわれることが確かめられた。また、動的環境では、 4)の深さ優先探索する戦略は頑健で、短い経路を選択した。しかし、試行錯誤 に要した距離は大きくなった。3)の経験的な戦略は、静的・動的環境下でも頑 健で、4)には及ばなかったもの、比較的短い経路を選択した。