遺伝的プログラミングを用いた協調行動の獲得

山本 哲也 (9951126)


近年,複数の自律的なエージェントが協調することにより複雑な問題の 実現をめざすマルチエージェントシステムが注目されている.マルチ エージェントシステムは,その複雑さゆえに,人間が問題に対応した 協調行動を完全に記述することは困難であるため,機械学習を用いて 協調行動の獲得を行う研究が盛んに行われている. マルチエージェント環境では複数のエージェントが互いに影響を及ぼし あいながら学習を行うため,強化学習では状態空間が大きくなりすぎる 等の問題が生じる.また,遺伝的プログラミングを用いて協調行動を 獲得する場合にも,状態空間が大きくなって行動戦略を表現する木構造 が深くなり,探索時間が非常に長くなってしまうという問題が生じる.

そこで,本発表では,遺伝的プログラミングを用いてマルチエージェント システムの協調行動の獲得について発表する.学習時の探索効率を上げるために, 状態を離散化して状態空間を小さくするとともに,世代交代時にノード にあたる各関数の状態分割を変更するすることにより探索空間を大きく し,目的の解を効率よく探索する手法を提案する. 本手法の有効性を確認するために,マルチエージェントシステムの例題 としてサッカー問題を取り扱い,サッカーの代表的な協調行動であるパ ス行動の獲得を行い,良好な結果が得られた.