音声認識における重み制御に基づくパラメータ統合に関する研究

杉本 浩史 (9751057)


人が音声でコミュニケーションを行う場合、実環境ではさまざまな雑音が存在 するために認識が困難なことも多い。機械が人間の音声を認識する時も同じこ とが言える。これは、あらかじめ記憶している音声モデルとその環境で発声さ れた音声とが異なっているためと考えられる。人はそのような場合、情報の信 頼度を変えてから理解していると考えられる。一般に音声認識では複数の特徴 量を組み合わせて認識の頑健性を高めている。現在の音声認識システムでは、 これら特徴量を同じ信頼度(各々の特徴量の重みは同じ)で用いているが、環境 によって信頼度は異なると思われる。そこで、特徴量ごとの信頼度(ストリー ム重み)を制御し、情報の信頼度を調節し適応化することを考える。本発表で は、隠れマルコフモデルを用いてストリーム重みを推定する方法として、ス トリームにべき乗で重みが掛かかるべき重み法と、出力確率の分散を重みで制 御する分散制御法を提案し、認識実験により、その有効性を検討する。