2009.9.5-9.12 ブライトン・イギリス
10th Annual Conference of the International Speech Communication Association
(Interspeech 2009)

音情報処理学講座:博士後期課程3年

【発表内容】
タイトル:"Many-to-Many Eigenvoice Conversion with Reference Voice"

本会議では,声質変換の新たな枠組みとして,様々な元話者の声質を任意の目標話者の声質への変換を実現する多対多声質変換の枠組みについて発表した.この枠組は,我々がこれまでに提案した固有声に基づく声質変換 (EVC) の枠組みである,任意の元話者から特定の目標話者への変換を行う多対一EVC,特定の元話者から任意の目標話者への変換を行う一対多EVCを順番に実行することで実現する.さらに,2つの変換過程間で生じる変換誤差を低減する手法を導入し,これについても発表を行った.


【会議の内容】
本会議は音声認識や音声合成といった,音声に関する様々なトピックを取り扱った会議である.音声合成の分野では,テキスト音声合成,音声変換,韻律生成などの研究が多く発表されていた.興味を持った発表としては言語情報を用いて声質変換用の変換モデルを学習し,変換を行うというものであった.客観評価によって音質が改善することが示されていたが,この手法では変換を行う際にも言語情報を用いているため,実用において,言語情報が付与されていない任意のデータに対してどのように対処するかが課題となると考えられる.


【研究技術交流等】

発表後に数人から研究内容に関する質問を受け,活発な議論を行うことができた.また,昨年訪問したケンブリッジ大学の学生や他の大学や企業の研究者と会い,交友を深めることができた.

2009.9.5-9.12 ブライトン・イギリス
10th Annual Conference of the International Speech Communication Association
(Interspeech 2009)

音情報処理学講座:博士後期課程3年

【発表内容】
喉頭摘出者が電気式人工喉頭を用いた音声(電気音声)を通常音声に統計的に変換する発声支援システムについて発表した.元の電気音声は抑揚が一定のモノトーンピッチしか持たないため,全ての音響特徴量は音韻特徴量から推定した.その結果,抑揚の推定は完全ではないが,元の電気音声と比べてより自然な音声を得ることに成功した.主観評価の結果,現状の変換通常音声でも元の電気音声より好ましい傾向があることが分かった.


【会議の内容】
本会議は,音声科学と音声工学に関する国際会議である.印象を受けた発表として,ネットワーク経由で音声を収録するシステムが提案されていた.これは,私がドイツの知人と開発を進めているシステムと同様のコンセプトである.他にも,類似のコンセプトで行われている研究があり,世界の研究レベルに対して危機感と緊張を覚えた.


【研究技術交流等】

これまでにいくつかの国際会議や短期滞在で知り合った研究者などと積極的に交流を行った.徐々に知り合いが増えてきた印象を受ける.その中には他分野の者も多いため,お互いの研究テーマ,関心について交流することで知見を広めることができた.