カスタマーレビュー文書からの省略された属性の推定を含めた意見情報抽出

柏木 潔 (1151034)


ブログやレビューサイト、Web掲示板などには商品に関する個人の意見や評価が数多く存在する. このような意見や評価は、顧客が商品を購入する際や企業が製品開発をする際の重要な情報となる. このため,ブログやレビューサイトなどから商品に関する意見や評価を収集し、分析する需要は大きく, これまでに意見情報抽出や評判情報抽出に関する研究が数多く行われてきた.

しかし、これまで行われてきた研究ではレビュー文書中に「このPCの性能はとても良い」といった風に商品(PC)の属性(性能)が明記されている場合のみを抽出の対象としていた. Web上にある文章では属性が省略されることも多いが、既存研究ではこのように表明されていない意見を抽出することができない. このため,レビュー文書中に存在する評価や意見に十分に対応できていないという問題がある.

そこで、本研究では属性が省略された場合も評価や意見の抽出対象とし、より網羅的な意見情報抽出を行うことを目的とする. 本研究では,まず評価値を抽出し,抽出した評価値に対する属性を抽出するという2段階の工程で機械学習を用いて意見情報抽出を行う. 本研究の貢献は、属性が省略されている場合にも対応した提案手法の性能評価を行いベースラインを超える成果を挙げたことと、機械学習に用いた素性の影響を調査し、その分析を行ったことにある.