NAMマイクを用いて収録した無声音声の品質改善

中桐 幹博 (0451084)


第三者に迷惑をかけない音声コミュニケーションの実現を目指し, 肉伝導非可聴つぶやき声(Non-Audible Murmur: NAM)から 通常音声への変換(NAM-to-Speech)による, 無音声電話の研究がなされている.

本研究では,実際に無音声電話への応用を考えた際, 様々な肉伝導音声に対応する必要があると考え, NAMおよびNAMマイクにより収録したささやき声(Body Transmitted Whisper: BTW) の通常音声化に関する検討を行う. また,NAMと肉伝導ささやき声(BTW)を併用してターゲット音声 と学習させる事で, 各々の入力に対して有効なモデルが作れることを示す.さらに, 無声音声から有声音声への声質変換における課題であった, 韻律の不自然性を回避するために, これらの肉伝導無声音声を空気伝導ささやき声に変換する方法を提案する. 主観評価実験の結果により, NAMから変換されたささやき声は,NAMから通常音声への変換音声と 比較し,より高い明瞭性を持ち,かつ 人間の発声としての自然性は大きく上回ることを示す.