ゼミナール講演
日時
平成13年7月18日(水)4限 (15:10 -- 16:40)
場所
L1
名前
李 晃伸
講演題目
大語彙連続音声認識のための探索アルゴリズム
概要
近年,音声認識技術の集大成として,人間のあらゆる発話を全て機械によって 文字に書き落す大語彙連続音声認識の技術が盛んに研究されている.この大語 彙連続音声認識では数万語の単語の任意の組み合わせを認識対象とするため登 場しうる文仮説数は膨大であり,最尤単語系列を素早く発見する高速な解探索 アルゴリズムが重要となる.講演者はこれまでに,大語彙連続音声認識のため の探索アルゴリズムとして,A*探索に基づく2パス探索に基づく手法を研究し てきた.本講演では,A*探索を大語彙で効率よく実現する単語トレリスインデッ クス法を中心に,木構造化辞書や種々の枝刈り法といった認識処理の効率化技 法を紹介する.なおこの研究成果は「汎用音声認識エンジン Julius」として フリーソフトウェアとして公開されており,音声認識コンソーシアムを通じて 配布されている.本講演ではこのコンソーシアムの活動紹介,および認識シス テムのデモンストレーションも行う.
名前
川波 弘道
講演題目
音声合成における韻律制御研究の動向
概要
音声言語は文字に対応する情報を伝達するのみならず, 統語構造や談話情報などの 高次言語情報や話者の態度や意図といった準言語情報,さらに話者の感情や個人性 といった非言語情報を伝達するという特徴を持つ.音声の生成過程は音源生成部と 調音部に分離することができるが,これらは主として音源部で制御されるものであ り韻律情報と呼ぶ.一般的な言葉でイントネーション,アクセント,発話リズム と呼ばれるこれらは,物理量としては声帯振動数や波形パワー,音素持続時間の大 局的な時間変化,および休止生起位置とその時間長として取り扱うことができる. テキスト読み上げツールなど音声合成技術において文字内容の明瞭な伝達が可能とな った現在,合成音声における表現の拡大をめざし韻律制御手法の研究が注目されて いる.ここでは合成音声における韻律生成に関する近年の研究を紹介する.