非可聴つぶやき強調音声の雑音環境下における明瞭性改善

鶴田 さくら (1351071)


非可聴つぶやき(Non-Audible Murmur: NAM)は,NAMマイクと呼ばれる専用の体表密着型マイクを用いて,体表から直接収録される体内伝導音声のひとつである.NAMは秘匿性の高い発話を可能とするため,サイレント音声通話への応用が期待されている.しかし,その音響特徴量は,通常の空気伝導音声のものとは大きく異なるため,明瞭性及び自然性が大きく劣化する.

この問題に対処するため,統計的手法に基づきNAMから通常音声及びささやき声へと変換するNAM強調法が提案されている.これまでに,遮音室のような静穏環境下での受聴評価において,NAM強調法によりNAMの品質を改善可能であること,また,通常音声よりもささやき声への変換の方が有効であることが報告されている.しかし,実環境下では,受聴時の環境は静穏環境下に限定されないため,同様の結果が得られるとは限らない.

本論文では,NAM強調技術の実環境への適用を目指し,受聴者が雑音環境下,発話者が静穏環境下にいる状況を想定し,明瞭性に着目した最適な変換目標音声の調査を行う.実験結果から,静穏環境下における最適な目標音声は話者により異なること,また,雑音環境下においては話者に限らず有声化による明瞭性改善効果が得られることを示す.