高次統計量に基づく音声歪みの理論解析および ミュージカルノイズフリー音声強調への応用

原田 真秀 (1251087)


本論文では,ミュージカルノイズ,音声歪みを最小化する非線形雑音抑圧手法を提案する. 従来の単一チャネル雑音抑圧手法は,高い雑音抑圧性能を有する一方, ミュージカルノイズと呼ばれる人工的な歪みが発生し, 致命的な音質劣化を引き起こすことが知られている.
この問題に対し,ミュージカルノイズ発生量の少ない高品質な雑音抑圧を達成するために, 弱い非線形雑音抑圧を反復的に行う反復型スペクトル減算法を用いて, ミュージカルノイズを全く発生させない最適なパラメータを, 高次統計量に基づいて数学的に導出し, 「ミュージカルノイズフリー雑音抑圧」という新たな雑音抑圧手理論として提案された. この手法においてミュージカルノイズ発生量を定量的に評価する際,Uemuraらによって提案された 高次統計量を用いた尺度が利用された.この尺度は人の聴覚と非常に高い相関を持つことが 示されている. しかし,この手法では,雑音区間のみに注目し,音声についての議論はなされていない.
そこで,本研究では雑音のみならず音声区間にもこの尺度を適用し,パラメータの最適化を図る. 音声区間は音声と雑音が混在しているため,正確なモデリングが困難であるので 雑音が音声よりも先に抑圧されるという仮定を用いてミュージカルノイズ,音声歪みを最小化する パラメータを示す.