部分観測環境におけるヒトの情報処理過程の隠れマルコフモデリング

大倉 昌徳 (0451022)


強化学習の分野では、環境をマルコフ決定過程(MDP)として定式化 することで様々な問題を解決する。しかし、実世界におけるより 一般的な問題では、エージェントが観測できる環境に関する情報は部分的である。 近年、このような問題に対して、部分観測マルコフ決定過程(POMDP)における 研究が注目を浴びている。 一方で、ヒトも常に同様の問題に晒されているにも関わらず、 適切に行動を選択することができる。ヒトがどのように部分観測性 を解決しているのかを知ることは、大変興味深いテーマである。 そこで本稿では、ヒトの情報処理過程を隠れマルコフモデルとして定式化することで、 POMDPの様相を持つ迷路の探索という複雑な課題を行ったヒトの行動を解析した結果を示す。 また、被験者の行動系列を基に脳内の認知負荷を見積もることで、課題遂行中に撮像 されたfMRI画像を解析できることを示す。