本研究では大語彙連続音声認識を用いて 音声対話エージェントを用いたWeb検索システムの構築を行い, 音声認識による誤認識や曖昧性を対話的に解消することで, どの程度タスク達成率が改善されるかに関する評価を行う.
本システムは 料理レシピ検索のタスクを対象とし, 画面上のエージェントとの対話的処理を通じて 検索対象に対する誤解や曖昧性の解消を行い,必要な情報を得ることができる. 誤認識においては,統計的言語モデルを用いた音声認識エンジンを利用することで 自由度の高い発話に対応する. 入力インタフェースには音声とマウスを用いる. システムは1発話ごとに検索結果をユーザに示し, ユーザはそれを見ながら検索キーワードの追加や削除を行う. このため音声入力が誤認識等により 正しくシステムに解釈されなかった場合でも, その誤解やキーワードの曖昧性を対話的に解決することができ,効率よくWebを検索することができる. さらに,キャラクタエージェントがユーザとシステムの仲介を行うことで, よりスムーズな意思疎通を図る.
検索キーワードの入力インタフェースとして音声を用いる場合の問題点,および 対話型インタフェースの タスク達成度への効果を調べるために, 本システムを実際に稼働させて評価実験を行った. 実験の結果,音声を入力とした場合, 検索キーワードの理解率は平均で70.2%に留まったにも関わらず, テキスト入力時の89.7% のタスク達成率が得られることが示された. また,タスク達成率低下の原因として,未知語などの認識困難な語や, データベースに存在しないために検索キーワードとして抽出されない語の 影響が大きいことを確認した.