隠れマルコフモデルに基づく強調音声の合成

森實 久美子 (0751131)


近年,任意のテキストから音声を生成するテキスト音声合成技術の発展により, 合成音声は我々の日常生活において多種多様な用途で使われている. 音声は言語情報だけでなく非言語情報を同時に伝達することができるコミュニケーション媒体であり,話者の感情や意図など数多くの情報を効率的に伝えることが可能である.

このような情報を効率よく伝達する合成音声を生成するためには,強調等のパラ言語情報の制御を可能とする音声合成技術の構築が重要となる. 本研究では,統計的ベースの音声合成方式の一つである隠れマルコフモデル(hidden Markov model: HMM)に基づく音声合成を用いて,任意のアクセント句を意図的に強調できる強調音声合成システムの実現を目指す. HMMに基づく音声合成では,様々な音声特徴量(スペクトル,基本周波数,継続長など)がHMMにより同時にモデル化されるため,それら全ての音声特徴量の同時制御が可能となる.

本発表では,通常音声と強調音声に対して個々のモデルを学習する手法と, 両音声を同時に用いて一つの混合モデルを学習する手法を用いてHMMを学習し, 構築したモデルを用いて強調音声を合成する.実験的評価結果から提案システムの有効性を示す.