音素環境を考慮した音素HMMモデルの構築
井上 由規 (9551008)
近年、HMM モデルをベースとした連続音声認識の分野が急速に発展している。
しかし、認識精度は十分ではなく、性能の良い HMM モデルが必要とされてい
る。そのため、大語彙音声認識においては、音素環境に依存したHMMモデル
(triphone model等)が用いられ、広く研究されている。英語においては、標
準データベースにおける triphone model の構築及び評価が一般的に広く研究
されているが、日本語における標準データベースにおけるモデルの構築及び評
価は不十分である。本研究の目的は、日本語の音素環境依存HMMモデル
(triphone model)の構築及び評価、さらには標準モデルとして配布できるよ
うにすることである。
本稿では、Bottom-Up の方法による、triphone モデルの作成方法を詳細に明
記し、作成方法及び、認識方法について考察している。そうすることにより、
標準モデルとして、また比較検討の対象として他の研究機関等で使用しやすい
環境を整えることができると考えている。また、triphone の作成には非常に
時間を要する。時間の節約のためにも、標準モデルとして配布することは重要
である。