2007/12/17-20 オーストラリア・ゴールドコースト、ブリスベーン
International Conference on Signal Processing and Communication Systems (ICSPCS’2007)
Queensland University of Technology

情報コミュニケーション講座:博士前期課程2年
ReportImage
 
【発表内容】
位相回転を用いて演算量を低減したピーク電力削減手法を提案した。ピーク電力削減手法としてクリッピング法がある。この手法は振幅値に対する演算処理であるためI/Qチャネル別にクリップを行う事で演算量を低減する手法が提案されている。この手法によるクリッピング法では信号の歪みが大きいため従来手法と比較して特性が劣化する問題がある。本研究ではI/Qチャネル別クリッピングに位相回転を取り入れることで演算量の低減を図りつつ信号品質の劣化の少ないクリッピング法を提案した。計算機シミュレーションにより性能を評価し、提案手法ではI/Qチャネル別クリッピングと同等の演算回数と従来のクリッピング法と比べても信号品質の劣化の少ないことを明らかにした。

【会議の内容】
ICSPCS’2007は、昨年まで別々に開催されていた信号処理分野の会議と通信分野の会議が合併し、今回初めて開催された会議である。取扱う分野は、通信から信号処理、ハードウェアからアプリケーションまで、広範囲に渡っていた。会議の特徴的な点として、シングルセッションで発表が進むことが挙げられる。会議の形式としては、複数のセッションが並行して行われて形が一般的であるが、本会議は全てのプレゼンテーションが同じ部屋で発表されるスタイルであった。そのせいもあり、2日目にもなると初めて会った参加者とも深くうち解けている様子が見られた。
ICSPCS’2007は、昨年まで別々に開催されていた信号処理分野の会議と通信分野の会議が合併し、今回初めて開催された会議である。取扱う分野は、通信から信号処理、ハードウェアからアプリケーションまで、広範囲に渡っていた。会議の特徴的な点として、シングルセッションで発表が進むことが挙げられる。会議の形式としては、複数のセッションが並行して行われて形が一般的であるが、本会議は全てのプレゼンテーションが同じ部屋で発表されるスタイルであった。そのせいもあり、2日目にもなると初めて会った参加者とも深くうち解けている様子が見られた。いくつかの発表のうちIPプロトコルを用いた次世代電話網において、異なる無線ネットワークを用いた場合のインターワーキングについて解析について興味を持った。モデルとして第3世代移動体システム準拠のUniversal Mobile Telecommunication System(UTMS)と無線LAN(WLAN)のネットワーク上でSession Initiation Protocol(SIP)を利用している場合にUTMSからWLANへの異なるネットワークへの橋渡しをする垂直ハンドオーバーを行った場合の、ハンドオフ回数とスループットや遅延特性の解析やハンドオフ時間とパケットロスの関係、シグナルコストにおけるリクエスト到着率と移動率の関係などを計算機シミュレーションでの結果を示した。その結果によると単純に無線通信の帯域を増加させるだけではハンドオフの遅延やパケットロスを減少させることは出来ないということを明らかにしていた。また移動制御におけるシグナルコストへの影響はセッション開始時の初期状態の設定によると示している。異なる無線ネットワーク間を通した場合でも継続的にサービスを提供していくためには垂直ハンドオフは無くてはならない技術である。そして垂直ハンドオフが通信品質に与える影響について評価を行い、無線帯域と信号品質の関係やシグナルコストの解析などが興味深い内容であった。

【研究技術交流等
今回参加したICSPCSは規模が小さいこともあり、半日も経てば多くの人と顔見知りとなり自分も会場で会った参加者と交流を深めることができ、、メルボルン大学に留学されている齋藤先生とも学会で久々にお会いすることができた。また、学会終了後には以前に研究室を訪問していただいた、Dhammika Jayalath先生の所属するクイーンズランド工科大学(QUT)を齋藤先生とともに訪問した、QUTはブリスベンにキャンパスを持つクイーンズランド州で最大の大学である。訪れたガーデンポイントキャンパスはブリスベン市内の中心部にあり非常に都会的な場所に位置している。都会のキャンパスだけあって敷地の中に高層の建物が多く、キャンパスと公園と植物園が隣接しているなど開放感あるキャンパスであった。週末であったこともあり学生は少なかったが、Dhammika先生と齋藤先生を交え交流することができ非常に有意義な時間を過ごすことができた。



2008/9/22-26 オーストラリア、ブリスベーン
INTERSPEECH2008
音情報処理学講座:博士前期課程2年

ReportImage
 
【発表内容】
ポスター発表。題目:"Low-Delay Voice Conversion Based on Maximum Likelihood Estimation of Spectral Parameter Trajectory"
私は、ある話者の声の質を変換する声質変換の研究をしており、その中でも特に「リアルタイム処理が可能で高品質な声質変換 」処理の研究に取り組んでいる。 短遅延処理として、最尤スペクトル系列変換に基づく時間再帰アルゴリズムを提案し、実験 的評価によりその性能を明らかにした。

【会議の内容】
NTERSPEECHは音声科学・研究者 のための会議で、ISCAという国際団体が管理をしているものである。音声音響に関する教科書でよく目にする方、全世界で広く 使われている手法及びモデルの開発者などが多く参加しており、私はその中でも「藤崎モデル」で有名な藤崎先生の講演を聴講 できた。藤崎モデルとは、音声の高さを表現する基本周波数の制御モデルの1つであり、全世界で広く用いられている。内容こ そ難しく理解が十分に追いつかなかったが、世界的に著名な方の発表をご本人の口から聞けた事は非常に嬉しかった。

【研究技術交流等
誠に残念ですが、言語の壁が非常に高く、他の参加者と技術交流を持つ事はできなかった。



2008/9/20-27 オーストラリア、ブリスベーン
INTERSPEECH2008
音情報処理学講座:博士後期課程2年

ReportImage
 
【発表内容】
喉頭摘出者の音声を声質変換によって改善するシステムについて、より実践的な使用を想定した検証を報告し た。1) 強調した聴覚フィードバックを話者に返すことで調音が安定すること、2) 実際の喉頭摘出者データを変換した結果、聞 き取りやすさは劣化するが自然性は改善すること、の2点についてポスター発表を行った。

【会議の内容】
本会議は、音声科学と音声工学に 関する国際会議である。印象を受けた発表として、発声障害者の音声認識において、間違えやすい音素を表す混同行列そのもの をモデル化することで、認識率の改善を目指す試みが報告されていた。発声リハビリテーションの現場では、音声療法士が耳を 頼りに音声の評価しており、膨大な時間が費やされている。このような技術によってよりスムーズな発声リハビリテーションが 期待される。

【研究技術交流等
Welcome reception 及び banquet において、他国の研究者と積極的に交流を行った。また、去年から友好関係のあるドイツの研 究者と、プロジェクトについて議論を行った。


2008/9/22-26 オーストラリア、ブリスベーン
INTERSPEECH2008
音情報処理学講座:博士後期課程1年

ReportImage
 
【発表内容】
9月23日の第4セッション(音声言語システム)にてポスター発表を行った。

本研究ではユーザの多彩な発話表現に応答できる音声対話システムを追究している。その実現方法の一つとして、ユーザ発話に類似した質問例をQADB(質問応答データベース)から検索して応答する、用例選択による応答生成手法が研究されている。本発表ではQADBの作成方法に関して、(1) 音声認識誤りに対処するため、収集したユーザ音声の音声認識結果を用いて質問例を作成する手法、(2) システム応答の正解率を向上させるため、QADBから不要な質問例を自動的に除去する最適化手法、の二つを提案した。提案手法を併用することで、特に音声認識誤りの多い子供音声での応答正解率が向上した。

【会議の内容】
人間の音声を扱う研究の世界的な大会。音声学・音声認識・音声信号処理・音声合成など、多彩なセッションが並行して開かれる。音声認識の分野では多言語音声認識、Web資源の活用、モバイル環境での音声認識に関する発表がみられた。音声対話システムでは、対話の履歴を用いて対話システムを自動的にモデル化する、POMDPを用いた研究が多く発表されていた。

特に関心を持った発表:
Hugo Van Hamme, HAC-Models: "A Novel Approach to Continuous Speech Recognition"
26日第3セッション(新しい枠組みの自動音声認識)の口頭発表。新生児の音声言語獲得のような、言語知識に依存しない音声認識手法を追究する。音声から単語を識別する一般的な手法では、音響特徴を元に定義した音素の生成確率を推定するが、本発表ではNMF (Non-negative Matrix Factorization) を用いて音響特徴から潜在的なパターンを抽出する手法を提案している。
NMFは画像処理や自然言語処理で近年利用されている手法で、データの持つパターンを直接獲得できる点で優れている。

【研究技術交流等
QADBの最適化手法に関して数件の質問があり、特に「質問例のデータベースから文章の意味を抽出できないのか」という質問があった。現状では、入力に認識誤りを含み、意味抽出の正確さを期待できないことから、質問例から意味を抽出する事は行っていない。しかし、意味の類似した質問例どうしで質問表現を補完する方法、および認識誤りの起こる状況でも意味を推定する方法があれば、入力に似た質問例がQADBに存在しない時に応答正解率が低くなる欠点を解消できると考えられる。