調波成分の瞬時周波数を利用したピッチ推定方法に関する研究
阿竹 義徳 (学籍番号)9851002
1996年に河原らが開発したSTRAIGHTは、VOCODER型分析合成方式であるにも関わらず、原音に迫る高い自然性を持った分析合成音を得ることが可能である。しかし、STRAIGHTは耐雑音性が低く、雑音環境化では合成音声の品質が大きく劣化するという弱点があった。それは、STRAIGHTが処理の各段階にピッチ周期に同期した処理を積極的に利用していて、雑音により推定されたピッチ周波数が誤差を含んだ場合、その影響を大きく受けることが原因と考えられる。
そこで本論文では、その欠点を克服するために耐雑音性の高いピッチ周波数推定方法を提案する。このため、従来のTEMPO法で用いられてきた基本波成分だけではなく、その調波成分も利用し、Cohenの帯域幅方程式を用いて統合する新しい方法を提案する。また、提案手法の性能の評価のために、音声データとEGGデータを同時収録したデータベースを作成した。これを用いて提案法およびTEMPOやCepstrum法といった従来法の推定精度の比較をした結果、提案法はそれらの従来法に比べて無雑音では同等以上で、雑音付加時の推定精度は大幅に改善されることがわかった。