音声対話エージェントを用いたグルメレシピWeb検索システム

松本 洋平 (0151100)


Internetに代表される情報基盤技術の急速な普及により, 世界中の情報に手軽にアクセスできるようになった. しかし,キーボードリテラシのない,いわゆる「情報弱者」は 必要な情報の入手が困難であるというDigital Divideの解消が急務になっており, 易しい検索インタフェースが求められている. 一方,近年,音声認識は飛躍的な発展を遂げ, 人間にとって自然なインタフェースである音声入力が マンマシンインタフェースの一つとして注目されはじめている.

本研究では大語彙連続音声認識を用いて 音声対話エージェントを用いたWeb検索システムの構築を行い, 音声認識による誤認識や曖昧性を対話的に解消することで, どの程度タスク達成率が改善されるかに関する評価を行う.

本システムは 料理レシピ検索のタスクを対象とし, 画面上のエージェントとの対話的処理を通じて 検索対象に対する誤解や曖昧性の解消を行い,必要な情報を得ることができる. 誤認識においては,統計的言語モデルを用いた音声認識エンジンを利用することで 自由度の高い発話に対応する. 入力インタフェースには音声とマウスを用いる. システムは1発話ごとに検索結果をユーザに示し, ユーザはそれを見ながら検索キーワードの追加や削除を行う. このため音声入力が誤認識等により 正しくシステムに解釈されなかった場合でも, その誤解やキーワードの曖昧性を対話的に解決することができ,効率よくWebを検索することができる. さらに,キャラクタエージェントがユーザとシステムの仲介を行うことで, よりスムーズな意思疎通を図る.

検索キーワードの入力インタフェースとして音声を用いる場合の問題点,および 対話型インタフェースの タスク達成度への効果を調べるために, 本システムを実際に稼働させて評価実験を行った. 実験の結果,音声を入力とした場合, 検索キーワードの理解率は平均で70.2%に留まったにも関わらず, テキスト入力時の89.7% のタスク達成率が得られることが示された. また,タスク達成率低下の原因として,未知語などの認識困難な語や, データベースに存在しないために検索キーワードとして抽出されない語の 影響が大きいことを確認した.