NAIST-IS-MT0651060: Shota TAKEUCHI

音声対話システムにおけるLeave-one-out交差検定法を用いた質問応答データベースの最適化手法

竹内翔大 (0651060)

ユーザにとって使いやすい音声対話システムは、どのような言い回し（発話表現）で話しかけても要求に応えられるシステムである。理想的な音声対話システムを実現するためには、高精度な音声認識技術だけではなく、多彩な発話表現に対しても適切に応答できる応答生成技術が必要となる。

多彩な発話表現に対処できる応答生成手法として、用例ベースの応答生成がある。この手法では実環境下で収集した質問例から質問応答データベース（QADB）を作成し、ユーザ入力に最も近い質問例を選択することで応答を生成する。用例ベースの応答生成の特徴は処理の簡便さであり、かつ、QADBが多様な質問例を持つほど、また質問例の傾向がユーザ入力の傾向に近いほど、より多彩なユーザ発話に対処できる。

用例ベースの応答生成での応答の精度を向上させる手法として、「QADBの最適化」が研究されている。この手法では大規模の質問応答データベースから不要なデータを自動的に除去する。しかし従来法には、一度しか出現しない不要データを除去することができないという問題点があった。

そこで従来法の持つ問題点を解決するため、本研究ではLeave-one-out交差検定法を用いたQADBの最適化手法を提案する。またユーザ入力の認識誤りを吸収するため、質問例に音声認識結果を用いる用例ベースの応答生成手法を提案する。