他者の内部状態推定と行動予測を用いた意思決定モデル
佐藤友美 (0651046)
マルチエージェント環境では,他者の内部状態の変化を相手モデルを用いて推定し,
それに基づいて行動を決定することが重要である.
近年,マルチエージェント課題遂行中のサルやヒトの行動に対して,相手モデルを含ま
ないモデルフリー強化学習による説明が試みられている.
これらの実験では自身の行動・報酬履歴のみから他者の行動が一意に決
まる課題設定が用いられているために,自身の意思決定において他者の内部状態変化を
明に推定する必要のない課題となっていた.
本研究では,他者の行動観測から他者の行動価値を推定可能であり,また行動価
値を考慮することにより最適な行動がとれる課題を開発した.
被験者の意思決定過程を,相手モデルを考慮したモデル同定強化学習として定式
化した.
また,本課題を用いてfMRI実験を行うことにより,提案モデルが被験者の行動
をよく説明し,さらにモデルに基づく脳活動解析により相手モデルの推定に前
頭前野が関わることを検証した.