解析型ICAkurtosisに基づく学習区間判定法を用いたリアルタイム音源抽出

藤原 裕樹 (0751102)


本発表では,実環境において独立成分分析(ICA)を用いたリアルタイムハンズフリー音声処理システムを正常に動作させるため,解析型二次統計量ICA(解析型SO-ICA)とkurtosisに基づく音源分離フィルタ学習区間判定法を提案する.従来のICAを用いたリアルタイムハンズフリー音声処理システムでは,時々刻々と変化する環境に追従するために,分離フィルタを逐次学習することが必要である. しかし,実環境でシステムを利用する場合,利用者が不在であり,雑音のみが存在する時間帯が多くを占める.このような時間帯において,利用者が存在する時間帯と同様に分離フィルタの学習を行うと,不適切な分離フィルタが生成され,システムの処理性能の低下に繋がる.提案法は上記の問題を解決する手法である. 本手法は以下のようなステップに従う.(I)解析型SO-ICAによってある程度の分離を行い,その分離信号のkurtosis値に基づいて利用者の発話の有無を判断する.(II)発話のある時間帯では,解析型SO-ICAの分離フィルタを初期値として反復型高次統計量ICAの学習を行う.このため提案法は,ハンズフリー音声処理システムが動作するような厳しい雑音環境下においても正確に利用者の発話の有無を判断することで,音源分離フィルタの学習区間を判定することができる. 加えて,高性能な分離フィルタを高速に再構成することができる.

続いて,提案法の性能が利用者の発話開始時点での解析型SO-ICAの分離性能に依存することに注目し,提案法が安定した性能を実現するための手法として,提案法における解析型SO-ICAの最良相関行列選択法について述べる.

また,本発表では,提案法の有効性を実験により示す.まず始めに,ハンズフリー音声処理システムが利用される厳しい雑音環境を模した環境で,音源分離フィルタ学習区間判定の実験を行う. この実験結果から,提案法は,従来法よりも優れた学習区間判定精度を実現することを確認する. 次に,ブラインド空間的サブトラクションアレーを用いた音源抽出実験を行う. この実験結果から,提案法は従来のハンズフリーシステムと比較して優れた雑音抑圧性能を示すことを確認する. 最後に,提案法における解析型SO-ICAの最良相関行列選択法の有効性を実験から確認する.