断片発話単位を適用した話し言葉音声合成に関する研究

瀬戸山勝義(0751066)


近年,様々な場面で音声合成技術が用いられるようになってきた. しかし,現在の音声合成技術の多くは読み上げ調の音声であり,より人間に親しみやすいインターフェースの実現には自発性を伴った話し言葉音声の音声合成が望まれる. また,現在の音声合成は文を発話単位として処理を行なっている. しかし,実対話においてそのようなことは稀であり,短い断片的な発話を多く用いる. 上記の話し言葉の特徴より,話し言葉音声合成を実現するために,話し言葉の特徴に則した新たな発話処理単位での音声合成が望まれている.

そこで本研究では話し言葉の特徴に則した新たな発話単位を提案し,話し言葉音声を分析することで,話し言葉音声の特徴に則した発話単位を決定し,その発話単位の韻律特徴のモデル化を行なった. その結果,話し言葉の発話単位として妥当な単位に分割できかつ,その韻律特徴モデル化に関する可能性を示すことが出来た. さらにその発話単位を用いた話し言葉音声合成システムの構成について述べる. 話し言葉音声のデータは,トピックフリーの雑談対話音声を収録したESP_Cコーパスを用いた.