音情報処理論
Speech Processing

講義内容

音声情報処理の基礎的な技術の理解と, 現在の技術レベルを理解させることと ともに, 基本的なアルゴリズムの概念を理解させることをめざして講義を行な う. 音声の性質, 分析, 認識, 合成, 符号化とかなり幅広く説明する.
講義には, テキストのコピーを配布するので, 必ずしも教科書や参考書を必要 としない. また, できるだけ数式を用いないで, 初心者でも理解できるように 講義を行なう.
  1. 音声分析(音声の概略, スペクトログラム, FFT, LPC)
  2. 音声認識(距離尺度, DTW, HMM, ニューラルネットによる音声認識, EMアルゴリズム, 話者認識, 話者適応)
  3. 統計的言語モデル(Nグラムモデル, 削除補間法, HMMーLRシステム, inside-outside アルゴリズム)
  4. 音響信号処理(雑音処理, HMM合成, エコーキャンセラー, マイクロフォンアレー)
  5. 音声合成(音声規則合成, 声質変換)
  6. 音声符号化(ADPCM, CELP, ボコーダー)

教科書

テキストを配布

参考書

  1. 中川, 鹿野, 東倉:音声・聴覚と神経回路網モデル, オーム社
  2. 古井:音響・音声工学, 近代科学社
  3. 中川:確率モデルによる音声認識, 電子情報通信学会

前提とする知識(必ずしも先修条件ではない)

とくになし