音声認識における重み制御に基づくパラメータ統合に関する研究
杉本 浩史 (9751057)
人が音声でコミュニケーションを行う場合、実環境ではさまざまな雑音が存在
するために認識が困難なことも多い。機械が人間の音声を認識する時も同じこ
とが言える。これは、あらかじめ記憶している音声モデルとその環境で発声さ
れた音声とが異なっているためと考えられる。人はそのような場合、情報の信
頼度を変えてから理解していると考えられる。一般に音声認識では複数の特徴
量を組み合わせて認識の頑健性を高めている。現在の音声認識システムでは、
これら特徴量を同じ信頼度(各々の特徴量の重みは同じ)で用いているが、環境
によって信頼度は異なると思われる。そこで、特徴量ごとの信頼度(ストリー
ム重み)を制御し、情報の信頼度を調節し適応化することを考える。本発表で
は、隠れマルコフモデルを用いてストリーム重みを推定する方法として、ス
トリームにべき乗で重みが掛かかるべき重み法と、出力確率の分散を重みで制
御する分散制御法を提案し、認識実験により、その有効性を検討する。