今までの音声符号化の研究において,分析合成符号化は高い情報圧縮率が得られるが,その品質はあまり高くないという問題があった.しかし1996年に河原らにより提案された STRAIGHT(Speech Transformation and Representation using Adaptive Interpolation of weiGHTed spectrum)は,分析合成方式であるにもかかわらず高品質な合成音声を作成することが可能である.この STRAIGHTを音声符号化に適用し,高品質な分析合成符号化方式の作成を目指す.
本研究では最初に主観評価による STRAIGHT の品質調査を行い,4bit ADPCM や 7bit μ-law PCM などと同等の品質が得られることを示す.次に STRAIGHT の声道情報の圧縮方法について検討を行い,スペクトルをケプストラム領域で表現することにより,スペクトル情報が 40 / 512 に圧縮可能であることを示す.次に声道情報の量子化について検討し,MA 予測を用いることにより SNRseg, CD がそれぞれ 0.60, 0.07 [dB] 改善されることを示す.最後に 8 [kbps] 音声符号化として体系化し,同じビットレートの CS-ACELP との比較を XAB 法により行う.その結果 CS-ACELP と同等の品質が得られることを示す.