日本語コーパスに対する ISO/DIS 24617-2に基づく対話行為ラベルを用いたアノテーションとその分析

井岡 孝徳 (1051003)


近年,言語処理の分野では,大規模な言語資源に基づく統計的な手法を用いた研究が盛んに行われている. 現在に至るまで,情報案内やホテル予約などのシステムのための対話行為ラベル付コーパスが多く作成されている. しかし,従来の対話行為ラベルによるアノテーションではタスク指向型システムのための記述しか行われていない. 一方で近年,より親しみやすいシステムの構築に向けて,相づちや対話ロボットの研究が行われている. これらは,従来のタスク指向型システムとは異なり,対話における話者間の相互作用に焦点があてられている. また現在,相互作用的な対話構造の特徴を記述可能である対話行為アノテーションのためのISO国際標準規格(ISO/DIS 24617-2)が提唱されている. ISO/DIS 24617-2における対話行為アノテーションは,ドメイン非依存で,発話の意図を表すために最適化されているという特徴がある. そこで本論文は,ISO/DIS 24617-2に基づく対話行為ラベルによる対話構造情報の記述を行ない,アノテーションにおける留意点などを検証する. この標準に基づくことで,従来のアノテーションでは重要視されてこなかった対話や発話の相互作用的特徴の記述が可能となり,相づちや対話ロボットなどのより親しみやすいシステム構築が可能になると期待される.

あとは、自由に HTML でつくってもらって結構です。なお、全体の分量として は、このページをプリントアウトした時に、A4 一枚程度になるようにしてく ださい。