年齢層別並列音声認識を用いた音声情報案内システム

西原洋平 (0251088)


音声認識技術を中核とする音声対話システムが近年注目を集めているが,駅などの公共の空間での利用を想定すると,高齢者や子供などを含めた幅広い年齢層の利用者を対象とする必要がある. しかし,高齢者や子供の発話音声の音響的特徴は成人のもと大きく異なるため,単一の話者層を想定した単体の音韻モデルでは高い認識精度を得ることが難しい. また,実際にはユーザの話者層や年齢層ごとに異なるインタラクションの様式を持つと考えられ,個別のユーザの利用目的に即した応答生成は音声対話システムの重要な課題である.

本研究では,あらゆる話者層や年齢層に対して十分な性能を提供し,かつ対象層に応じた柔軟な音声対話を実現するために,(1)年齢層別音韻・言語モデルを用いた並列音声認識,(2)発話者年齢層の自動識別,(3)年齢層依存の応答生成,の3つの手法を統合した実環境向けの音声対話システムを提案する.年齢層別の音声認識モデルを用いて並列に音声認識を行い尤度基準でモデルを選択することで,年齢層に対し適切なモデルを用いた音声認識を行う.さらに,その選択結果から話者層を識別し,それに従って年齢層に即した応答生成を行う.

現在,生駒市コミュニティセンターにおいて提案システムのフィールドテストを実施し ている.本発表では,提案したシステムの評価を行い結果を報告する.