NAIST-IS-MT1251089: Hirano Yuka

頑健な音声カートシス推定に基づく音声認識率予測及びミュージカルノイズフリー反復型雑音抑圧の制御

平野佑佳 (1251089)

本論文では，独立成分分析 (independent component analysis: ICA) を用いて動的に推定した雑音信号を用いた新しい音声カートシス推定法を提案する．従来の音声歪みの評価尺度であるケプストラム歪みを求めるには，雑音を含まない真の音声信号が必要となる．そこで，教師なしで音声歪み量が測定可能な音声カートシスが提案されている．これまで，音声カートシスの推定法として，観測信号と推定雑音信号から直接計算を行い推定する手法と，予めカートシステーブルを作成して，テーブルルックアップで求める手法が提案されている．前者には推定雑音信号の信号長が短いと安定して音声カートシスを推定できないという問題があり，後者には信号対雑音比 (signal-to-noise ratio: SNR) によって使用するカートシステーブルが異なるため，音声カートシスの推定精度がSNRの推定精度に依存するという問題がある．そこで，本研究ではこれらの問題点を解決するために，ICA で推定された雑音を用いて音声カートシスを推定する手法を提案する．提案手法の有効性を確認するために，従来の音声カートシス推定法との比較実験を行い，提案法が総合的な面で優位であることを確認する．

続いて，上記の提案手法を音声認識率予測に適用した手法を提案する．音声認識率を予測する要素として，雑音抑圧性能，音声歪み量，ミュージカルノイズ発生量が有効であると言われている．従来，音声歪み量の評価にはケプストラム歪みを用いているが，ケプストラム歪みは実環境下では用いることが出来ない．そこで，実環境下で安定かつ高精度に音声カートシスを推定できる提案手法を導入し，提案手法による推定音声カートシスが音声認識率を予測する要素として有効であるかの確認を行う．音声認識実験の結果より，提案推定法による推定音声カートシスが音声認識率予測に有効であることを実証する．

次に，提案した音声カートシス推定法をミュージカルノイズフリー雑音抑圧法である反復型ブラインド空間的サブトラクションアレー (blind spatial subtraction array: BSSA) の反復回数の制御に適用した手法を提案する．反復型BSSAは聴覚的に不愉快なミュージカルノイズを発生させずに雑音抑圧を行うが，その反面，反復とともに音声歪み量も増加するという問題がある．そのため，雑音抑圧量だけではなく，音声歪み量も考慮して反復回数の決定を行わなければならない．現在，反復回数の決定は経験に基づく主観で行っており，反復回数を客観的に決定する評価指標が必要とされている．そこで，本論文で提案した音声カートシス推定法を用いた反復回数制御法を提案する． %提案した音声カートシス推定法を用いれば，教師なしで安定に音声カートシスの推定が可能であり， %また，反復型BSSAにおいて雑音抑圧処理前後の雑音信号の統計的特徴が不変であるため，モーメント-キュムラント変換により，入力波形および出力波形から音声カートシス比を推定可能である． %音声カートシス比を求めることで，反復型BSSAにおける反復回数の限度値を設定することが出来る．提案手法の有効性を確認するために，客観評価実験を行い，提案手法により，主観的に音声カートシス比の限度値を設定することで，反復型BSSAの反復回数を制御することが出来ることを示す．