NAIST-IS-MT0051098: Mikiko MASHIMO

Pronunciation Evaluation based on Cross-language Voice Conversion using Dual-language Databases

真下美紀子 (0051098)

本論文では, コンピュータによる外国語学習者の発音評価に向けて, 日英言語間における声質変換と, 声質変換を適用した学習者の英語発声文章中の音素発音評価を行う方法について検討する.

現在の計算機語学学習支援システム(CALL)おける問題点は、音声情報処理技術を用いた客観的な発音評価を行う際, 教師音声と学習者音声の間に話者性の差が存在することである. また, 練習用のテンプレートは, 音素や単語を単体で発声させるものが多く, 実際に即した学習を提供しているとは言い難い. そこで, ある話者の発話音声を別話者の発話音声に変換する声質変換技術を用いた発音評価法を提案する. 具体的には, 教師音声を語学学習者音声に変換した音響的特徴と, 語学学習者自身の音響的特徴とを比較して, 文章中の発音誤りの判定を行う. 声質変換技術により話者性の問題を回避し, 発声を文単位とすることにより実際に即した学習を提供できる.

声質変換システムとして, 近年開発された混合正規分布とSTRAIGHT分析合成方式に基くシステムを使用する. これは, 同一言語間における話者性変換成果が報告されている. しかし, 実際のCALLにおいて学習者の外国語発話がデータベースは存在しない. そのため, 話者間の声質変換パラメータは日本語で学習した後, 教師の英語に適用, すなわち, 異なる言語間に渡って適用されねばならない. 本発表では, 日英バイリンガル男女音声を用いて異なる言語間においても話者性変換の効果が得られることを示す. さらに, 文章発話中の音素を用いて, 声質変換を適用した場合に人間による発音評価スコアと本稿の評価尺度との相関が現れることを確認し, 発音評価法の一つとしての有効性も示す.