述語の選択選好性に着目した名詞評価極性の獲得

東山 昌彦 (0651102)


事態の評価極性(ポジティブもしくはネガティブ)を判別することは,意見情報抽出のようにテキストの深い理解を必要とする応用処理で重要である.これには,例えば「ゴミが増える」における「ゴミ」のように,名詞の評価極性が重要な手がかりとなる場合が少なくない.

そこで,本稿では,まず事態を表す「名詞+格助詞+述語」の3つ組についてWebコーパス上で頻出する表現を収集し,名詞の評価極性の重要性を調べ,約4割の評価極性を持つ組が名詞の評価極性に依存し,名詞が事態の評価極性判定には重大な役割を持つことを確認した.したがって,名詞の評価極性を十分な数獲得できれば,事態の評価極性の判別も容易になると考えられる.

このような名詞の評価極性を獲得するため,「〜を好き」はポジティブな名詞と共起しやすく,「〜が嫌い」はネガティブな名詞と共起しやすいといった評価極性についての述語の選択選好性を利用することにより,名詞の評価極性の知識を自動獲得することを考えた.そのアイディアを利用するため,5億文の大規模なWebコーパスから「名詞」と「格助詞+述語」の共起関係を抽出し,機械学習手法によって,名詞の評価極性の知識を自動獲得する.実施した評価試験で,提案手法が(Takamuraら 2007)の手法をベースラインとした場合,比較して高い精度で評価極性の獲得ができたことを報告する.