音声分析合成法STRAIGHTによる低ビットレート音声符号化
吉岡 大祐 (9851126)
本発表では、音声分析合成法STRAIGHTを用いたディジタル移動体通信用低ビット
レート音声符号化について述べる。低ビットレート音声符号化は、音声生成モ
デルに基づくパラメータを符号化する分析合成系の符号化方式により実現するこ
とができる。しかし、これまでの分析合成系の符号化方式は、十分な音声品質を
得ることができないという問題があった。音声分析合成法STRAIGHTは、分析
合成方式にもかかわらず、高品質な合成音声を生成することが可能である。本
発表では、このSTRAIGHTのディジタル移動体通信用音声符号化への適用及び、STRAIGHTを用いた低ビットレート音声符号化について述べる。
本発表では最初に、STRAIGHTがディジタル移動体通信用音声符号化に利用可能で
あるかを見極めるための評価実験結果について述べる。
次に、STRAIGHTが分析時に生成する声
帯・声道情報の圧縮手法である、ピッチ同期処理及び、声道情報のLSPによるパ
ラメータ化について述べる。次に、情報源である声帯・声道
情報に対する量子化手法について述べる。最後に、約1.9kbpsの音声符号化とし
て体系化し、提案する符号化系と他の音声符号化方式との品質比較を主
観品質評価実験により行なう。その結果、LPC10(2.4kbps)と比較して、ほぼ同
等の品質でありながらも、ビットレートを約20\%削減できることを示す。