データ拡張による感情分析のアスペクト推定

西本慎之介 (1551074)


自然言語処理学においてテキスト分類は, 幅広く研究され, 応用されてきた.とくに感情分析はテキスト分類の応用として著名な分野の一つである. 感情分析とは与えられた文に対して, その文の極性(肯定的か否定的か)を付与するものである. 本論文では, 感情分析の中でもアスペクトベースの感情分析について扱う. このタスクでは, 与えられた文に対して極性を付与するだけでなく, 文のアスペクトラベルも付与する. たとえば, ``fried rice here is amazing." という文が与えられた場合, 出力として``positive" という極性と ``food"というラベルを付与する.先行研究では, この分野では教師あり機械学習が高い精度を出してきた.加えて, 近年ではニューラルネットワークベースの研究が高い精度を出している.しかしながら, ニューラルネットワークベースの研究では, 大量の訓練データが必要になる.もし, データの量が小さければニューラルネットワークの精度は低いものになる.この問題を解決するために, 我々はデータ拡張を用いる.「データ拡張」という用語は, 教師なしデータを導入することで, 最適化や, サンプリングを行うアルゴリズムである.我々は, ニューラルネットワークと言語処理に用いられるデータ拡張を比較しながら, 最高精度を達成した.