NAIST-IS-MT1151012: Itoi Miyuki
ユーザ動作雑音を含む非可聴つぶやきにおけるブラインド音声抽出
糸井 三由希 (1151012)
静粛な環境などの発話行為自体を躊躇する状況でもコミュニケーションを行う技術として,
NAMを用いた音声コミュニケーションが提案されている.NAMは他人に聴受されないほど小さな無声音声であり,体表に直接圧着させるNAMマイクロホンによって収録される.
そのため,ユーザの動作によりNAMマイクロホンの圧着環境が大きく変動し,収録信号に非定常な雑音が混入し,円滑なコミュニケーションの妨害となってしまう.
この問題を解決するために,ブラインド空間的サブトラクションアレー (blind spatial subtraction array: BSSA)
をステレオNAM信号に適用する手法が提案されているが,雑音推定及び抑圧の面で更なる改良の余地があった.
また,NAMの実用化を考慮すると様々なマイクロホンを用いたNAMの収録を試みることが必要である.
そこで本研究では,従来研究に使用されていたNAMマイクロホンのみならず,スロートマイクロホン,粘着式NAMマイクロホンを用いてマルチチャネルNAM信号の同時収録を行い,
得られたデータに対し,チャネルを拡張をしたNAMの雑音抑圧手法を提案する.
まず,雑音推定手法として,スパース信号抽出(sparse signal extraction: SSE)を導入する.
この手法を用いることにより,マルチチャネル異種センサを統合させた雑音推定が可能となる.
次に,雑音抑圧部において一般化スペクトル減算法及び一般化ウィーナフィルタを適用し,最も高精度な雑音抑圧が可能なパラメータを調査する.
以上の雑音推定手法及び雑音抑圧手法を導入して提案法とし,従来法との比較実験を行い,
提案法は総合的な音質の面で優位であることを確認した.