高道 慎之介 | 1361007: D, 中間発表 | 中村 哲、松本 裕治、戸田 智基、Sakriani Sakti、Graham Neubig |
title: Quality Improvement Methods Based on Modulation Spectrum for Statistical Parametric Speech Synthesis
abstract: Speech synthesis, a technique to synthesize speech from input information, augments our communication and reality in the perspective of spoken language. Consequently, such techniques require the speech synthesis that can flexibly control the voice characteristics (i.e., emotion) and synthesize high-quality speech. Statistical parametric speech synthesis I focus on makes it possible to control the characteristics, but it tends to generate low-quality speech. This talk addresses the quality improvements based on modulation spectrum. *** replace this part with the abstract of your talk IN ENGLISH *** language of the presentation: Japanese 発表題目: 統計的パラメトリック音声合成のための変調スペクトルに基づく音質改善法 発表概要: 入力情報から音声を合成する音声合成技術は、音声言語の観点で我々のコミュニケーションや現実感を拡張するための技術である。 故に、環境に応じた声質(音声の感情など)の制御、及び、自然性の高い音声生成を可能にする音声合成技術が必要とされる。 統計的パラメトリック音声合成は、合成音声の声質制御を可能にするものの、低音質の音声を合成する傾向にある。 本発表では、統計的パラメトリック音声合成に対する変調スペクトル基準の導入により、合成音声の音質改善に取り組む。 | ||