本研究では,仲間のエージェントの行動推定に注目し,行動推定を行いながら 協調行動を学習する手法を提案する.
本研究では,協調学習時の行動推定の影響を調査するため,追跡問題(複数の ハンターが協調して獲物を捕獲する問題)を取り上げる.
仲間のエージェントの行動推定を利用せずに学習する方法と,仲間のエージェ ントの行動推定を利用して学習する方法を実験により比較した結果,仲間の行 動推定を利用して学習する方法の方が,協調行動の獲得スピードが速くなり, より効果的な協調を行えることがわかった.