しかし、これまで行われてきた研究ではレビュー文書中に「このPCの性能はとても良い」といった風に商品(PC)の属性(性能)が明記されている場合のみを抽出の対象としていた. Web上にある文章では属性が省略されることも多いが、既存研究ではこのように表明されていない意見を抽出することができない. このため,レビュー文書中に存在する評価や意見に十分に対応できていないという問題がある.
そこで、本研究では属性が省略された場合も評価や意見の抽出対象とし、より網羅的な意見情報抽出を行うことを目的とする. 本研究では,まず評価値を抽出し,抽出した評価値に対する属性を抽出するという2段階の工程で機械学習を用いて意見情報抽出を行う. 本研究の貢献は、属性が省略されている場合にも対応した提案手法の性能評価を行いベースラインを超える成果を挙げたことと、機械学習に用いた素性の影響を調査し、その分析を行ったことにある.