真偽情報・価値情報を考慮した拡張モダリティ解析

江口萌 (0851014)


文章には、事象のみならず、その事象に対する書き手の主観的な態度(モダリティ)も記述される。
情報抽出などの応用分野において、個々の事象の核となる述語とその項構造を認識するだけではなく、 事象(生起)に対する書き手の確信度、書き手の表明している態度などを解析することは重要である。
そこで、本研究は、書き手の表明する態度や、事象の真偽情報、価値情報等を統合した情報を拡張モダリティと呼び、これらを体系づけた上で、その解析システムの構築に取り組んだ。

本発表では、以下の4点について報告する。
1.拡張モダリティを表す7つ組のタグ体系の設計
2.設計した体系に基づくコーパスの構築
3.動詞、形容詞を中心とする内容語(自立語)が拡張モダリティに与える影響を記述した、拡張モダリティ解析のための手掛かり表現辞書の作成
4.一事象内のタグ間、同一文中に出現する事象間の依存関係を考慮できる条件付確率場を用いた解析システムの構築

4の解析システムを分析した結果、拡張モダリティ解析の精度向上には、タグ間、事象間の依存関係を考慮することが有効であることが有意に証明された。
さらに、出現頻度が低いタグの解析精度が低いという問題を解決するため、選択的サンプリングを行い、その結果、選択的サンプリングによる学習も精度の向上に貢献することが明らかになったため、 そちらについても報告する。