行列因子化法の混合モデルへの拡張と映画レーティング予測への応用

中村 政義 (0851079)


近年,膨大な商品の中からユーザに適切な商品を推薦する商品推薦システムが普及している. 多くの推薦システムでは,ユーザーが商品に対してつけたレーティング(評価値) のデータを基 に商品を推薦する.そのデータは多くの場合,行列で表現され,大部分が欠測した非常にスパース な行列となっている.この行列の欠測部分を予測することは,ユーザがまだ評価してない商品の レーティングを予測することに対応し,推薦システムにとって重要な意味を持つ.この欠測予測 手法の1 つとして行列因子化法が知られている.行列因子化のコスト関数は,平均が因子化され たガウス分布の対数尤度関数と一致するため,行列因子化法は行列要素がガウス分布であると仮 定している.しかし,実際のデータではユーザーの性質がグループをなしている場合があり,単 一モデルの仮定が適切ではない場合がある.我々はこのようなデータに対応するため,行列の要 素が混合ガウス分布に従っているとするモデル化を提案する.本報告では,欠測予測問題に対し て人工データを用い,どのようなデータに対して提案手法が有効であるかを議論した後,実デー タに対して適用した結果を報告する.