一問一答型音声対話システムにおける 統計的機械翻訳を利用した応答文生成

西村一馬 (1051082)


音声情報案内システム「たけまるくん」では質問文例と対応する応答文のペアで構成される質問応答データベース(QADB)から単語マッチングにより入力質問文に最も近い質問文例を選択し,それに対応する応答文を出力する応答文生成方式を採っている. この手法によりユーザ発話の意味理解など高度な解析をする必要なく応答文を出力できる. しかし,この手法では応答文は定型文しか出力できない. 「たけまるくん」のユーザはコミュニケーションを目的とした発話をすることが多い傾向にあり,ユーザとのインタラクション改善も重要である.

ユーザとのインタラクションを改善するための方法として応答文に多様性を持たせることが考えられる. 本研究では応答文に多様性をもたせるための手法として統計的機械翻訳による応答文生成を提案する. 提案手法は質問文と応答文を別の言語とみなした翻訳を行うことで質問文を応答文に変換しようとするものである. 書き起こし文による実験を行ったところ,適切な応答の生成率が約60%あり,新たな文表現の応答文も生成され,手法の実現可能性が示された. 更に音声認識仮説を複数用いて学習と入力を行ったところ,適切な応答の生成率が約10%向上し, 実用のシステムに搭載するにはさらなる性能改善が望まれるが,本手法による柔軟な応答文生成の可能性が示唆された.

キーワード:音声対話, 応答文生成, 統計的機械翻訳, 音声認識仮説, 実環境データ