バイアス付き事前SNR推定を導入したMMSE-STSA推定器の理論解析およびミュージカルノイズフリー音声強調法への拡張

中井駿介 (1251072)


本論文では,最小平均二乗誤差規範短時間振幅スペクトル(minimum mean-square error short-time spectral amplitude: MMSA-STSA) 推定器に基づくミュー ジカルノイズフリー音声強調法を提案する.現在,多数の音声通信に関するアプ リケーションが研究されており,その中でも音声強調法は重要な問題の1 つとし て挙げられている.たとえば,単一チャネル入力に基づく効果的な非線形音声強 調法として,スペクトル減算法(spectral subtraction: SS),ウィーナーフィルタリ ング(Wiener filtering: WF) およびMMSE-STSA 推定器が提案されている.これ らの単一チャネル非線形音声強調法は,高い雑音抑圧性能を有する一方,ミュー ジカルノイズと呼ばれる人工的な歪みが発生し,致命的な音質劣化を引き起こす ことが知られている.

先行研究において,ミュージカルノイズ発生量を定量的に評価するために,Uemura らによって高次統計量を用いた評価尺度が提案されている.また,この評価 尺度に基づいてSS によって生じるミュージカルノイズ発生量に関する理論解析が 行われている.理論解析結果より,SS の内部パラメータを最適な値に設定するこ とで,雑音は抑圧されるがミュージカルノイズが全く発生しない,つまりミュージ カルノイズフリー状態が存在することが明らかにされた.さらに,Miyazaki らは, このミュージカルノイズフリー状態を達成する内部パラメータを導出し,ミュー ジカルノイズを発生させずに雑音抑圧を行う,ミュージカルノイズフリー音声強 調法を提案している.また,Miyazaki らはWF においてもミュージカルノイズ フリー状態を達成する内部パラメータを明らかにしている.しかし,これまで MMSE-STSA 推定器におけるミュージカルノイズフリー状態については検討がな されていない.そこで,本研究ではMMSE-STSA 推定器においてミュージカル ノイズフリー状態が存在することを明らかにし,MMSE-STSA 推定器に基づいた ミュージカルノイズフリー音声強調法を提案する.MMSE-STSA 推定器は,音声 の統計的な事前モデルに基づいており,SS やWFと比較してミュージカルノイズ 発生量,音声歪み量ともに少ない音声強調法であるため,提案手法により音声品 質の改善が期待される.

近年,MMSE-STSA 推定器によって生じるミュージカルノイズ発生量が数値積 分を用いた解析により明らかにされた.これにより,従来のMMSE-STSA 推定器 にはミュージカルノイズフリー状態が存在しないことが確認されている.そこで, 本研究では,MMSE-STSA 推定器にバイアス付き事前SNR 推定を導入する.そ して,理論解析により,バイアス付き事前SNR 推定を導入したMMSE-STSA 推 定器においてミュージカルノイズ状態が存在することを明らかにする.さらに, MMSE-STSA 推定器に基づくミュージカルノイズフリー音声強調法の有効性を確 認するため,従来の音声強調法との比較実験を行う.