適応雑音推定処理を備えた空間的サブトラクションアレーを用いたハンズフリー音声認識 

木内 千絵 (0451045)


実環境下での頑健なハンズフリー音声認識を実現するために, 適応雑音推定処理を備えた新しい空間的サブトラクションアレーアルゴリズムを提案する.空間的サブトラクションアレー(SSA)は, 音声強調された信号のパワースペクトルから, 雑音を推定した信号のパワースペクトルをメルフィルタバンク上で減算することで雑音抑圧を行う.雑音推定に死角制御型ビームフォーマ(NBF)を用いた従来のSSAは, 雑音推定フィルタが無残響かつマイクロホン素子の特性誤差がない状態を仮定して設計されるため, 高残響環境下では雑音推定精度が低く, 十分な音声認識精度を得られないという問題があった.

本論文では,高残響環境下においても正確な雑音推定を行うために, SSAの雑音推定部に適応雑音推定処理として適応ビームフォーマ(ABF)を導入した新しいSSAアルゴリズムを提案する.本研究では, ABFとして目的音方位の利得を1に保ちながら非目的音を最小化するFrost型アレーを用いる.Frost型アレーは, フィルタの設計に反復学習が必要ないため, 高速処理が可能である.ABFは, ユーザ音声の残響に対してだけではなく, マイクロホン素子の誤差に対しても頑健なフィルタを作成することが可能である.したがって, 高残響下において正確な雑音推定が可能であると考えられる.また, 残響を反映させた音韻モデルをSSAに導入し, その有効性を実験を通じて確認した.

提案法及び従来法を用いた評価実験結果より, 高残響下において提案法が高精度な認識精度を達成することがわかった. また, 残響を考慮した音韻モデルを用いることで認識精度が向上することを確認した.