発話スタイルに応じた発話速度と無音区間の分析

正木 芽衣子 (961812)


近年,音声言語処理技術の進展にともない,単に言語情報を伝達するだけでなく, 話者の意図や感情などのパラ・非言語情報をも伝達可能な, 様々な発話スタイルにも対応可能な合成音声が求められている. 発話スタイルが形成される要因には多くのものが考えられるが 時間要因はどのスタイルにも深く関わっており, 意図や感情を示す際にも,ゆっくり話す,速く話すといった 発話速度の制御が欠かせない. 本研究では,様々な発話スタイルでの 音声合成を可能にする継続時間長の予測モデル構築を目標とし, 発話速度及び対象となる聞き手が異なるデータ間の分析を行う. 速い,普通,遅いの3つの発話速度で物語を読み上げた 発話と聞き手に幼児を想定して絵本を用いて読み聞かせた発話をを収録し, コーパスを作成した. これら4種類のコーパスを用いて, 発話部分の継続時間長及びポーズについて分析を行った.