空間的サブトラクションアレーに基づくハンズフリー音声認識システムのための 音響モデルに関する検討

高木 惠世 (0551075)


本論文では,空間的サブトラクションアレー(SSA) に基づくハンズフリー音声 認識のための音響モデルについて提案をしている.実環境において,頑健にハン ズフリー音声認識を行うためには,周囲の雑音や残響を考慮する必要がある.そ の対処法として,2 つの側面からアプローチを行った.1 つ目のアプローチとし てはマイクロホンアレー信号処理による雑音抑圧である.これには雑音抑圧能力 が高く音声認識に特化した非線形信号処理であるSSA を用いた.また,2 つ目の アプローチとしては音声認識システムにおける音響モデルの考慮である.一般に SSA では残響の抑圧がほとんどできない.また,従来の比較的クリーンな環境で 構築した音響モデルではSSA で処理した音声スペクトルとは不一致が起こってし まう.そこで,SSA に特化した音響モデルを提案した.この音響モデルは,構築 の際の音声データベースに残響を畳み込み,雑音を重畳し,SSA の処理を行い出 力された信号を用いて学習をすることで構築する.これにより,実際に音声認識 時に使用されるSSA の出力と一致する.本論文ではこの音響モデルの有効性を実 験を通して論ずる. 従来から用いられている音響モデルと提案する音響モデルを用いて行ったシ ミュレーション評価実験では,提案した音響モデルの方が高い認識精度を 導くことがわかり,SSA マッチドモデルの有効性が示せた. また,SSA マッチドモデルを用いて実環境における評価実験を行ったところ, SSA を用いて構築した音響モデルの有効性を改めて確認した.