ビームフォーマによる周波数帯域補間を用いた独立成分分析に基づく
高速ブラインド音源分離
大迫慶一 (0651020)
本発表では,ビームフォーマによる周波数帯域補間を用いた独立成分分析(ICA)に基づ
く高速ブラインド音源分離(BSS)手法を提案する.
従来提案されているICAに基づくBSSは,分離フィルタが十分な性能を得られるま
での収束速度が遅いという欠点を持つ.
従って,ハンズフリー音声認識のようなリアルタイム処理を必要とするシステム
の前処理において,収束速度が遅いBSSは致命的な欠点となる.
この収束速度の遅さを解決するために,提案法は以下3つのステップにて構成され
る周波数帯域補間及び演算量削減を行う.(I)ICAによって学習する周波数帯域を選択する.(II)ICAによって学習を行い,音
源到来方位(DOA)を推定する.(III)推定されたDOAよりビームフォーマを形
成し,残りの周波数帯域を補間する.
提案法は,補間するビームフォーマの特性を任意で設定することができ,様々
な音場環境において用いることができる.
まず初めに,従来のBSSの研究で行われていた点音源の分離問題を扱
う.
点音源の分離では,死角制御型ビームフォーマ(NBF)を補間することによって高速化を
実現する.
音源分離実験より,提案法が従来法よりも高速に動作することを示す.
次に,実環境におけるハンズフリー音声認識システムを想定し,点音源と無数に存在する
非点音源の分離問題を扱う.
まず,このような環境では,補間に用いるべきビームフォーマは遅延和アレーとNBFとなること
を証明する.
そして,ビームフォーマ補間手法に加え,音源の確率密度を考慮した高速化手法を提
案し,それらを統合した手法が高速に収束することを音源分離実験により示
す.
最後に,提案法をブラインド空間的サブトラクションアレーの雑音推定部に導入
し,音声認識実験により提案法の有効性を示す.