NAIST-IS-MT9751057: Hiroshi Sugimoto

音声認識における重み制御に基づくパラメータ統合に関する研究

杉本浩史 (9751057)

人が音声でコミュニケーションを行う場合、実環境ではさまざまな雑音が存在するために認識が困難なことも多い。機械が人間の音声を認識する時も同じことが言える。これは、あらかじめ記憶している音声モデルとその環境で発声された音声とが異なっているためと考えられる。人はそのような場合、情報の信頼度を変えてから理解していると考えられる。一般に音声認識では複数の特徴量を組み合わせて認識の頑健性を高めている。現在の音声認識システムでは、これら特徴量を同じ信頼度(各々の特徴量の重みは同じ)で用いているが、環境によって信頼度は異なると思われる。そこで、特徴量ごとの信頼度(ストリーム重み)を制御し、情報の信頼度を調節し適応化することを考える。本発表では、隠れマルコフモデルを用いてストリーム重みを推定する方法として、ストリームにべき乗で重みが掛かかるべき重み法と、出力確率の分散を重みで制御する分散制御法を提案し、認識実験により、その有効性を検討する。

音声認識における重み制御に基づくパラメータ統合に関する研究

杉本 浩史 (9751057)

杉本浩史 (9751057)