ゼミナール発表

日時: 9月25日(火)2限 (11:00-12:30)


会場: L1

司会: 川波 弘道
犬飼辰夫 1151013: M, 2回目発表 中村哲, 鹿野清宏, 戸田智基, サクリアニサクティ, グラムニュービッグ
title: pectral parameter variation between utterances of the same sentence by a single speaker and its prediction
abstract: We propose prediction spectral parameter variation between utterances of the same sentence by a single speaker from prosodic variation. we evaluate predicting performance of proposed method.
language of the presentation: Japanese
発表題目: 特定話者の同一文発話間におけるスペクトル特徴量変動とその予測
発表概要: 本発表では,声質変換におけるよりよい学習尺度や評価尺度を得るために, 特定話者の同一文発話間におけるスペクトル特徴量変動について調査を行い, 韻律の違いからスペクトル特徴量変動を予測する方法を提案する. そして,提案手法の実験的評価について結果と考察を述べる.
 
高道慎之介 1151063: M, 2回目発表 中村哲, 鹿野清宏, 戸田智基, サクリアニサクティ, グラムニュービッグ
title: A Study on HMM-based Speech Synthesis Using Rich Context Models
abstract: In this paper, we propose parameter generation methods using rich context models in HMM-based speech synthesis as yet another hybrid method combining HMM-based speech synthesis and unit selection synthesis. In the traditional HMM-based speech synthesis, generated speech parameters tend to be excessively smoothed and they cause muffled sounds in synthetic speech. To alleviate this problem, several hybrid methods have been proposed. Although they significantly improve quality of synthetic speech by directly using natural waveform segments,they usually lose flexibility in converting synthetic voice characteristics. In the proposed methods, rich context models representing individual acoustic parameter segments are reformed as GMMs and a speech parameter sequence is generated from them using the parameter generation algorithm based on the maximum likelihood criterion. And we propose its improvement method. Since a basic framework of the proposed methods is still the same as the traditional framework, the capability of flexibly modeling acoustic features remains.
language of the presentation: Japanese
発表題目: 分散共有フルコンテキストモデルの有効性に関する検討
発表概要: 隠れマルコフモデル(Hidden Markov Model:HMM) に基づく音声合成において,生成される音声パラメータは過剰に平滑化される傾向にあり,肉声感の低い音声が合成される.この問題を改善するために,HMM 音声合成と素片選択型合成のハイブリッド法がいくつか提案されている.波形素片の使用により,合成音声の音質は顕著に向上するが,同時にHMM 音声合成の利点である音響モデリングの柔軟性が失われる.本稿では,HMM 音声合成の利点を保持したハイブリッド法として,分散共有フルコンテキストモデルによる音声パラメータ生成法を提案する.提案法では,素片毎の音声パラメータを持つ分散共有フルコンテキストモデルを混合正規分布としてモデル化し,最尤基準に基づいたパラメータ生成アルゴリズムにより音声パラメータを生成する.また、本稿ではその改善方法についても示す。
 
森口拓人 1151106: M, 2回目発表 中村哲, 鹿野清宏, 戸田智基, サクリアニサクティ, グラムニュービッグ
title:Implementation of real-time body-conducted voice conversion on DSP
abstract:Real-time voice conversion process based statistical approach is effective for silent voice communication with body conducted speech. In this presentation, we implement the conversion process on DSP, and evaluate the effectiveness.
language of the presentation: Japanese
発表題目:リアルタイム肉伝導変換処理のDSP上への実装
発表概要:肉伝導音声を用いたサイレント音声コミュニケーションにおいて,統計的手法に基づくリアルタイム音声変換処理が有効である.本発表では,本変換処理をDSP上にて実装し、その有効性について評価する.
 
和田昌宣 1151119: M, 2回目発表 中村哲, ニックキャンベル, 柏岡秀紀, 戸田智基