NAIST-IS-MT9751079: Yasuo Nagayuki

マルチエージェント環境における他エージェントの行動推定と協調学習

マルチエージェント環境において，エージェントが協調行動を学習により獲得することは，動的な環境への適応という観点から重要な問題であり，効率の良い学習法の提案が必要とされている．

本研究では，仲間のエージェントの行動推定に注目し，行動推定を行いながら協調行動を学習する手法を提案する．

本研究では，協調学習時の行動推定の影響を調査するため，追跡問題（複数のハンターが協調して獲物を捕獲する問題）を取り上げる．

仲間のエージェントの行動推定を利用せずに学習する方法と，仲間のエージェントの行動推定を利用して学習する方法を実験により比較した結果，仲間の行動推定を利用して学習する方法の方が，協調行動の獲得スピードが速くなり，より効果的な協調を行えることがわかった．