NAIST-IS-MT1151012: Itoi Miyuki

 

ユーザ動作雑音を含む非可聴つぶやきにおけるブラインド音声抽出

糸井 三由希 (1151012)


静粛な環境などの発話行為自体を躊躇する状況でもコミュニケーションを行う技術として, NAMを用いた音声コミュニケーションが提案されている.NAMは他人に聴受されないほど小さな無声音声であり,体表に直接圧着させるNAMマイクロホンによって収録される. そのため,ユーザの動作によりNAMマイクロホンの圧着環境が大きく変動し,収録信号に非定常な雑音が混入し,円滑なコミュニケーションの妨害となってしまう. この問題を解決するために,ブラインド空間的サブトラクションアレー (blind spatial subtraction array: BSSA) をステレオNAM信号に適用する手法が提案されているが,雑音推定及び抑圧の面で更なる改良の余地があった. また,NAMの実用化を考慮すると様々なマイクロホンを用いたNAMの収録を試みることが必要である. そこで本研究では,従来研究に使用されていたNAMマイクロホンのみならず,スロートマイクロホン,粘着式NAMマイクロホンを用いてマルチチャネルNAM信号の同時収録を行い, 得られたデータに対し,チャネルを拡張をしたNAMの雑音抑圧手法を提案する. まず,雑音推定手法として,スパース信号抽出(sparse signal extraction: SSE)を導入する. この手法を用いることにより,マルチチャネル異種センサを統合させた雑音推定が可能となる. 次に,雑音抑圧部において一般化スペクトル減算法及び一般化ウィーナフィルタを適用し,最も高精度な雑音抑圧が可能なパラメータを調査する. 以上の雑音推定手法及び雑音抑圧手法を導入して提案法とし,従来法との比較実験を行い, 提案法は総合的な音質の面で優位であることを確認した.