Seminar II, 2001

ゼミナール講演

日時	平成13年7月18日(水)4限 (15:10 -- 16:40)
場所	Ｌ１

名前	李　晃伸
講演題目	大語彙連続音声認識のための探索アルゴリズム

概要: 近年，音声認識技術の集大成として，人間のあらゆる発話を全て機械によって文字に書き落す大語彙連続音声認識の技術が盛んに研究されている．この大語彙連続音声認識では数万語の単語の任意の組み合わせを認識対象とするため登場しうる文仮説数は膨大であり，最尤単語系列を素早く発見する高速な解探索アルゴリズムが重要となる．講演者はこれまでに，大語彙連続音声認識のための探索アルゴリズムとして，A*探索に基づく２パス探索に基づく手法を研究してきた．本講演では，A*探索を大語彙で効率よく実現する単語トレリスインデックス法を中心に，木構造化辞書や種々の枝刈り法といった認識処理の効率化技法を紹介する．なおこの研究成果は「汎用音声認識エンジン Julius」としてフリーソフトウェアとして公開されており，音声認識コンソーシアムを通じて配布されている．本講演ではこのコンソーシアムの活動紹介，および認識システムのデモンストレーションも行う．

名前	川波弘道
講演題目	音声合成における韻律制御研究の動向

概要: 音声言語は文字に対応する情報を伝達するのみならず，統語構造や談話情報などの高次言語情報や話者の態度や意図といった準言語情報，さらに話者の感情や個人性といった非言語情報を伝達するという特徴を持つ．音声の生成過程は音源生成部と調音部に分離することができるが，これらは主として音源部で制御されるものであり韻律情報と呼ぶ．一般的な言葉でイントネーション，アクセント，発話リズムと呼ばれるこれらは，物理量としては声帯振動数や波形パワー，音素持続時間の大局的な時間変化，および休止生起位置とその時間長として取り扱うことができる．テキスト読み上げツールなど音声合成技術において文字内容の明瞭な伝達が可能となった現在，合成音声における表現の拡大をめざし韻律制御手法の研究が注目されている．ここでは合成音声における韻律生成に関する近年の研究を紹介する．