本文へジャンプ

研究室紹介

>>研究室一覧へ

音情報処理学研究室

新しい音声メディアによるユニバーサルコミュニケーションを目指す

音情報処理学研究室では、マンマシンインタフェースにおける音声の役割、ネットワークでの音と音声の問題、マルチメディアにおける音の効果などを考え、音声と音の統合により新しい音声・音の分野を創成することを目指しています。とくに、新しい音声メディアによる子どもからお年寄りまで、障害者も含めたユニバーサルコミュニケーションの研究を進めています。

〈教 員〉 教 授 : 鹿野 清宏
准教授 : 猿渡 洋
助 教 : 川波 弘道、原 直
研究室ホームページ
鹿野 清宏 教授
鹿野 清宏 教授

主な研究テーマ

音声認識・音声対話システム・音声検索

自由に発話した音声の認識や音声による情報検索を目指します。音声認識の実現には実環境での音声の収録に基づいた統計的な方法に基づくアプローチが必要です。統計的な方法や機械学習に基づく音韻モデル・言語モデル・音声対話データベースの学習アルゴリズム、対話システムの構築、音声検索技術の研究に取り組んでいます。コミュニティセンター、学研北生駒駅、遷都1300年に音声情報案内システムを構築して、実環境における実証実験も行っています。

音声合成・音声変換

統計処理に基づく音声の合成技術を研究しています。声色やイントネーションを適切に制御して、より情報量に富んだ音声をテキストから合成する手法を研究しています。また、より多様な音声を実現するために、音声変換・モーフィングの研究も行っています。声質を自在に制御するコントローラーや、あらゆる人の声を特定の声へと変換するボイスチェンジャーなどを開発しています。この応用例として、声質を保存した音声翻訳や外国語音声吹き替え、発声障害者音声の自然性・個人性の改善を目指した発声障害者補助の研究も行っています。

マイクロホンアレー・ブラインド音源分離

遠隔から発声される音声を精度良く集音するために、信号処理により自由に指向性を構成・変更できるマイクロホンアレーの研究を行っています。また、情報理論に基づいて「互いに独立な音源同士」に音を分解するブラインド音源分離に関しても研究を行い、DSPへの実装も行っています。

音臨場感再現・音楽信号処理

反射・残響といった部屋の特性を制御することにより、音空間を全く別の部屋で再現することができます。このような音場再現システムを、複数スピーカにより実現する研究をしています。また、ブラインド音源分離や波面ベクトル量子化技術を応用して、音楽信号における音像配置を自由に操作できる技術の研究も進めています。音場の可視化技術の研究も進めています。

ロボット音声対話システム

ロボットとの自然なコミュニケーションを実現するためには、実環境にて遠隔発話された音声を高精度かつ高速に認識・理解する必要があります。これを達成するため、リアルタイム・ブラインド音源分離や新しい発話区間検出処理を開発して、雑音に対してロバストなハンズフリーロボット対話システムの構築を行っています。

無音声認識・無音声電話

最近、非可聴つぶやき(Non-Audible Murmur;NAM)が認識できることを発見しました。この技術は、声を出さなくても音声認識ができる無音声認識や、声を出さなくても音声通話ができる無音声電話の実現の可能性が大いにあることを示唆しています。他人に聞かれない、やかましくない音声メディアの実現で、音声の利用範囲が大きく広がりました。

研究設備

  • 64chマイクロホンアレー
  • 音場再現システム(64ch、32ch)
  • 対話ロボット「キタロボ」
  • 情報案内システム「たけまる」
  • 音場可視化装置
  • 最新PCクラスター(60cpu、240core)
  • ファイルサーバー(40TB) 等

研究室の魅力

音に関する技術について、世界中を見渡しても類を見ないほど、多種多様なテーマを研究しています。世界トップレベルの研究に打ち込める環境が整っており、研究の面白さを思う存分堪能でき、自分の可能性を最大限に発揮できます。博士後期課程の学生はもちろんのこと、前期課程の学生であっても、自身の研究成果を国外・国内で発表する機会に満ち溢れています。自分の開発したシステムを公共の場で運用し、一般の人々に利用してもらう機会も提供できる研究室です。

音声案内システム「キタちゃん」の研究開発風景
音声案内システム「キタちゃん」の研究開発風景

最近の研究状況

新たに3名が博士号を取得
博士論文
  • 大谷 大和:"Techniques for Improving Voice Conversion Based on Eigenvoices," 2010年3月
  • 高橋 祐:"Blind Speech Enhancement with Independent Component Analysis and Spectral Subtraction," 2010年3月
  • 中村 圭吾:"Speaking-Aid Systems Using Statistical Voice Conversion for Electrolaryngeal Speech," 2010年3月
通算30名
新たに11名が修士号を取得
通算150名を突破
大型研究プロジェクト
  • 戦略的創造研究推進事業(CREST):"マルチモーダルな場の認識に基づくセミナー・会議の多層的支援環境," 2009年~
  • 総務省戦略的情報通信研究開発推進制度(SCOPE):"音情景分解に基づく音メディア・ユニバーサル・コミュニケーション・ システムの研究開発," 2008年~
  • 総務省戦略的情報通信研究開発推進制度(SCOPE):"発声障害者補助のための統計的声質変換技術の研究開発," 2008年~
  • 文部科学省科学研究費補助金基盤研究(A):"新しい音声メディアによるユニバーサルコミュニケーションの研究," 2007年~
  • 文部科学省科学研究費補助金基盤研究(A):"聴覚・音声機能の支援・拡張技術に関する総合的研究," 2007年~
共同研究
トヨタ
パナソニック
ヤマハ
NEC など