ブログ情報とブログユーザ間のリンク構造を用いた著者の年齢推定

酒井啓道 (1151051)


ブログの増加に伴いブログ記事をマーケティングで使う機会が増えてきた.通常マーケティングでは性別や年齢などの属性が重要となるが,多くのブログユーザーは自身の属性を公開していないため,推定する必要がある.先行研究では,ブログ情報を使う手法とリンク情報を使う手法が提案されているが両者を考慮に入れた研究はなかった.本研究では,ブログ情報とリンク情報の両方を利用することにより,ブログ著者の年齢推定を行った.その結果,従来の手法に加え精度の改善が見られたことを報告する.また,ラベルなしデータを利用した手法についても報告する.