NAIST-IS-MT9851126: Daisuke Yoshioka

音声分析合成法STRAIGHTによる低ビットレート音声符号化

吉岡大祐 (9851126)

本発表では、音声分析合成法STRAIGHTを用いたディジタル移動体通信用低ビットレート音声符号化について述べる。低ビットレート音声符号化は、音声生成モデルに基づくパラメータを符号化する分析合成系の符号化方式により実現することができる。しかし、これまでの分析合成系の符号化方式は、十分な音声品質を得ることができないという問題があった。音声分析合成法STRAIGHTは、分析合成方式にもかかわらず、高品質な合成音声を生成することが可能である。本発表では、このSTRAIGHTのディジタル移動体通信用音声符号化への適用及び、STRAIGHTを用いた低ビットレート音声符号化について述べる。

本発表では最初に、STRAIGHTがディジタル移動体通信用音声符号化に利用可能であるかを見極めるための評価実験結果について述べる。次に、STRAIGHTが分析時に生成する声帯・声道情報の圧縮手法である、ピッチ同期処理及び、声道情報のLSPによるパラメータ化について述べる。次に、情報源である声帯・声道情報に対する量子化手法について述べる。最後に、約1.9kbpsの音声符号化として体系化し、提案する符号化系と他の音声符号化方式との品質比較を主観品質評価実験により行なう。その結果、LPC10(2.4kbps)と比較して、ほぼ同等の品質でありながらも、ビットレートを約20\%削減できることを示す。

音声分析合成法STRAIGHTによる低ビットレート音声符号化

吉岡 大祐 (9851126)

吉岡大祐 (9851126)