韻律・音韻の部分補正に基づく話者性を保持した日本人英語音声合成

大島悠司 (1351016)


日本語母語話者の話者性を反映した英語音声合成用音響モデルを構築するため には,日本人英語(ERJ: English Read by Japanese)に含まれる話者性を最大限 に活用する枠組みが有効であると考えられる.しかしながら,日本人英語の利用 により,言語体系の違いに起因する日英間の韻律の相違や音韻誤りの影響を強く 受けるため,自然性が大きく劣化するという問題が生じる.これに対し本論文で は,日本語母語話者の話者性を保持したまま,より自然な英語音声を合成する手 法を提案する.まず,日英間の韻律の相違に着目し,英語母語話者の韻律情報と モデル適応に基づく日本人英語音声の韻律補正法を提案する.また,合成音声の 自然性をさらに改善するために,英語母語話者の音韻情報と無声子音スペクトル 置換に基づく日本人英語音声の音韻補正法を提案する.実験的評価結果から,モ デル適応による韻律補正により,日本語母語話者の話者性を保持しつつ,自然性 の高い英語音声を合成することができ,無声子音スペクトル置換による音韻補正 により,より自然性を改善できることを示す.