多彩な発話表現に対処できる応答生成手法として、用例ベースの応答生成がある。この手法では実環境下で収集した質問例から質問応答データベース(QADB)を作成し、ユーザ入力に最も近い質問例を選択することで応答を生成する。用例ベースの応答生成の特徴は処理の簡便さであり、かつ、QADBが多様な質問例を持つほど、また質問例の傾向がユーザ入力の傾向に近いほど、より多彩なユーザ発話に対処できる。
用例ベースの応答生成での応答の精度を向上させる手法として、「QADBの最適化」が研究されている。この手法では大規模の質問応答データベースから不要なデータを自動的に除去する。しかし従来法には、一度しか出現しない不要データを除去することができないという問題点があった。
そこで従来法の持つ問題点を解決するため、本研究ではLeave-one-out交差検定法を用いたQADBの最適化手法を提案する。またユーザ入力の認識誤りを吸収するため、質問例に音声認識結果を用いる用例ベースの応答生成手法を提案する。