発話者の発話意図を考慮した¥¥対話型音声合成手法の提案

豊川 弘樹 (1051073)


近年,合成音声は我々にとって身近なものとなってきており,より親しみやすいものとなってきた.しかし,従来の音声合成システムの多くは朗読調であり,ユーザと対話によるコミュニケーションを想定したシステムにおいてはより人間らしい合成音声か望まれている.一方で現在,対話構造の特徴を表すDialogue Act Annotation(DAA:対話行為注釈)のためのISO国際標準規格が提唱されている.DAAはドメイン非依存で発話者の目的,発話意図を表すために最適化されているという特長がある.また,従来のText-to-Speech(TTS:テキスト音声合成)は,人間同士のコミュニケーションにおいて重要となるパラ言語情報を合成音声に考慮することができないという問題があった.そこで本論文では,DAAをTTSに適用した対話型音声合成手法を提案し,自然対話音声に対しDAAを用いてラベリングされたコーパスを用いて,発話者の発話意図を考慮した合成音声を出力する音声合成器を試作することで,提案手法が発話者の発話意図が正しく表現できることを確認した.本手法は,声に障害を持つ人,ロボットの発話やコールセンターなど様々な場所での利用が期待される.