意見抽出を目的とした評価表現の収集

小林のぞみ (0251041)


Web上に多数存在する掲示板サイトには,個人ユーザから寄せられた 大量の文書が蓄積されている. それらの中には,組織や個人に対する評価や噂,商品・サービスに対する 不満の声などが無数に含まれており, こうした文書から意見情報を自動的に収集・解析する技術への関心が高まっ ている.

本研究では,意見の主要部分は対象,属性,評価から構成されると考え, 意見を〔対象, 属性, 評価〕の組で抽出することを考えている. そのために,評価を表す表現が重要な手がかりとなるが, 評価表現には「燃費がよい」「CGがきれい」といった領域依存の 表現が多数存在するため,人手で書き尽くすことは困難である.

そこで,本研究では対象,属性,評価の共起情報に基づくパタンを利用して, これら領域依存の表現を効率的に収集することを試みた. 本発表では,共起パタンに基づく属性・評価表現の半自動的収集方法を提案し, 「コンピュータ」と「ゲーム」の2つの領域を対象に, 人手と提案手法で行なった収集効率実験の結果について報告する.