サブワード情報に着目した対話行為推定モデルの検討

河野 誠也 (1651038)


対話行為推定は,対話システムにおける対話制御においてユーザの状態を推定し,追跡するために必要となる重要な構成要素の一つである.対話行為推定の精度は対話制御,ひいては対話システム全体の性能へと影響を与える.そのため,高精度な対話行為推定器の構築は対話システムにおけるユーザビリティを向上させるうえで重要である.対話行為推定における問題点の一つに,未知語(OOV)や低頻度語の問題がある.対話行為推定器の訓練に用いることができる対話データの量が少ない場合,多くの低頻度語やOOVが発生することがある.低頻度語やOOVは,統計モデルの汎化性能を低下させることが知られている.単語より短い分割単位であるサブワードは,しばしばこうした問題を防ぐための有効なアプローチとして用いられる.本研究では,サブワードによるアプローチが対話行為推定のタスクにおいても有効であると仮定し,発話におけるサブワードの系列を入力とした対話行為推定モデルを構築した.サブワード分割手法には,Byte Pair Encodingを採用した.実験の結果,サブワードを用いた対話行為推定モデルは単語単位の入力を用いた対話行為推定モデルと比較して,データサイズが小さく,また,低頻度語が頻出するような対話ドメインにおいてその有効性が確認できた.