抽出型文書要約における分散表現の学習-文書と要約の距離最小化-

田口雄哉 (1551058)


抽出文書要約は,入力文書の最も重要な情報を捉えている文を与えられた長さに関する制限の中で抽出するタスクである.近年,言語処理の多くのタスクにおいて分散表現が精度向上に寄与していると報告されている.抽出型文書要約においては,分散表現を用いて文間の類似度を測ることで,抽出する文を選ぶ要約手法が提案されてきた.言語処理の他のタスクにおいては,タスクに応じた分散表現を学習することで,精度が向上することが報告されている.抽出型の文書要約においても同様に,文書要約のタスクに適した分散表現を学習することで,性能の改善が期待できる.そこで本研究では,分散表現を用いて入力文書と参照要約をベクトル空間に埋め込み,その距離の最小化を行うことを述べる. 本実験の結果,提案手法により抽出型要約の精度が向上することが確認できた.