Using prosodic information to discriminate between declarative and interrogative utterances having the same text. -Using prosody in speech translation system-

秦 早穂子(0051083)


音声翻訳システムは, 音声認識・言語翻訳・音声合成の順で入力音声を目的音声へと変換し, 変換結果を目的言語の音声で出力する. しかし文字列では肯定として解釈できる自然対話中の疑問文, たとえば「よくここに来るの?」, 「毎日何時間も長電話する?」などの文章に関して, 従来の音声翻訳システムでは、音声認識から認識結果の文字列を翻訳部分に渡してしまうため, それらは平叙文として処理され的確に翻訳結果を出力することができない.

一方、疑問文か平叙文かという文のタイプを決定する手法に関する研究は、これまでに文末のF0値やパワーの変化などで文のタイプを決定する手法が提案されている.しかし対象となる文は語彙情報から平叙・疑問を判別できるものの分析が多く, 同じ文字列で解釈が異なるデータに対しては報告されていない.

ここではそういった同じ文字列の文章を, 疑問文・平叙文それぞれに読み上げた音声データを収録しそれぞれのF0情報を分析, 判別規則の提案を行なった.