指数族行列因子化の状態空間モデルへの拡張と時系列関係データ解析への応用

林 浩平 (0751094)


WEB のリンク構造,人の繋がりからなる 社会ネットワーク,学術論文の共著関係,あるいは生体ネットワークにおける 遺伝子対遺伝子関係など, オブジェクトの関係として表現される,いわゆる関係データ はあらゆる分野に存在する. 特に,関係データのモデリングと解析はデータマイニングや機械学習の分野において近年注目を集め ている.

本研究は,Eメールの送受信履歴など,動的に変化する関係データを解析するための新たな 確率モデルを提案する. 本モデルは,2値や頻度など,離散値をとる静的な関係データの解析に適した指 数型行列因子化 (Gordon, 2002) に対し,時間的に変動する潜在要因を取り入れた 状態空間モデルとして定式化される.データの変動を比較的少数の潜在要因によ り記述することでノイズの影響を減らし,予測性能 の向上が期待される. 我々は,提案したモデルについて逐次ベイズ学習の枠組みより, 真のパラメータの変動に追従する逐次学習アルゴリズムを導出する.

計算機実験では,一般公開されているエンロン社社員のメール送受信デー タを用い,既存手法に比べ本モデルが関係構造を適切に学習し,予測しうることを示す.