行列因子化法の混合モデルへの拡張と映画レーティング予測への応用
中村 政義 (0851079)
近年,膨大な商品の中からユーザに適切な商品を推薦する商品推薦システムが普及している.
多くの推薦システムでは,ユーザーが商品に対してつけたレーティング(評価値) のデータを基
に商品を推薦する.そのデータは多くの場合,行列で表現され,大部分が欠測した非常にスパース
な行列となっている.この行列の欠測部分を予測することは,ユーザがまだ評価してない商品の
レーティングを予測することに対応し,推薦システムにとって重要な意味を持つ.この欠測予測
手法の1 つとして行列因子化法が知られている.行列因子化のコスト関数は,平均が因子化され
たガウス分布の対数尤度関数と一致するため,行列因子化法は行列要素がガウス分布であると仮
定している.しかし,実際のデータではユーザーの性質がグループをなしている場合があり,単
一モデルの仮定が適切ではない場合がある.我々はこのようなデータに対応するため,行列の要
素が混合ガウス分布に従っているとするモデル化を提案する.本報告では,欠測予測問題に対し
て人工データを用い,どのようなデータに対して提案手法が有効であるかを議論した後,実デー
タに対して適用した結果を報告する.