マルチエージェント環境における他エージェントの行動推定と協調学習

長行 康男(9751079)


マルチエージェント環境において,エージェントが協調行動を学習により獲得 することは,動的な環境への適応という観点から重要な問題であり,効率の良 い学習法の提案が必要とされている.

本研究では,仲間のエージェントの行動推定に注目し,行動推定を行いながら 協調行動を学習する手法を提案する.

本研究では,協調学習時の行動推定の影響を調査するため,追跡問題(複数の ハンターが協調して獲物を捕獲する問題)を取り上げる.

仲間のエージェントの行動推定を利用せずに学習する方法と,仲間のエージェ ントの行動推定を利用して学習する方法を実験により比較した結果,仲間の行 動推定を利用して学習する方法の方が,協調行動の獲得スピードが速くなり, より効果的な協調を行えることがわかった.