音声分析合成法STRAIGHTによる低ビットレート音声符号化

吉岡 大祐 (9851126)


本発表では、音声分析合成法STRAIGHTを用いたディジタル移動体通信用低ビット レート音声符号化について述べる。低ビットレート音声符号化は、音声生成モ デルに基づくパラメータを符号化する分析合成系の符号化方式により実現するこ とができる。しかし、これまでの分析合成系の符号化方式は、十分な音声品質を 得ることができないという問題があった。音声分析合成法STRAIGHTは、分析 合成方式にもかかわらず、高品質な合成音声を生成することが可能である。本 発表では、このSTRAIGHTのディジタル移動体通信用音声符号化への適用及び、STRAIGHTを用いた低ビットレート音声符号化について述べる。

本発表では最初に、STRAIGHTがディジタル移動体通信用音声符号化に利用可能で あるかを見極めるための評価実験結果について述べる。 次に、STRAIGHTが分析時に生成する声 帯・声道情報の圧縮手法である、ピッチ同期処理及び、声道情報のLSPによるパ ラメータ化について述べる。次に、情報源である声帯・声道 情報に対する量子化手法について述べる。最後に、約1.9kbpsの音声符号化とし て体系化し、提案する符号化系と他の音声符号化方式との品質比較を主 観品質評価実験により行なう。その結果、LPC10(2.4kbps)と比較して、ほぼ同 等の品質でありながらも、ビットレートを約20\%削減できることを示す。