空気/体内伝導マイクの併用による外部雑音に頑健な非可聴つぶやき強調

田尻 祐介 (1451069)


サイレント音声コミュニケーションの実現に向けて,非可聴つぶやき(Nonaudible Murmur: NAM)を 専用の体表密着型マイク(NAMマイク)で収録する枠組みが提案されている. しかし,体内伝導収録された音声の音響特徴量は,通常の空気伝導収録された音声のものと異なり, 明瞭性および自然性が大きく劣化する.これを解決するため,統計的手法に基づき, NAMを通常音声やささやき声へと変換するNAM強調法が提案されている. ただし,従来の研究では,防音室のような静音環境で収録したNAMのみを使用しているため, NAM強調技術を実環境へ適用するには,実環境下で起こりうる要因を考慮する必要がある. 特に,NAMのような非常に微弱な音声信号の収録では,外部雑音の影響を無視できない. 例えば,外部雑音がNAMマイクに混入した場合,従来技術による変換音声は著しく劣化する.

このような問題の解決に向けて,本発表では異種センサ統合に基づく新たな枠組みとして, 空気/体内伝導マイクを併用した二種類の手法を提案する. 一つ目の手法では,空気伝導マイクを口元に設置することで, 目標とする音声と類似した特徴を持つ空気伝導音声としてのNAMを収録し, 統計的声質変換の入力に加えることで,強調精度の改善を試みる. 二つ目の手法では,空気中に放射されるNAMの音量が微弱である ことに着目して,空気伝導マイクを口元から離した位置に設置 することで,外部雑音のみの収録を実現し,NAMマイクに混入する 外部雑音の抑圧処理に利用する. 実験的評価結果から,一つ目の提案法により,静穏下,雑音下を問わず, 強調音声のスペクトル変換精度および聞き取りやすさを改善できることを示す. また,二つ目の提案法により,雑音混入による変換音声の劣化を大幅に改善できることを示す.