ゼミナール講演

日時: 平成24年4月25日(水)3限 (13:30 -- 15:00)
場所: L1

講演者: 原 直
題目: 音声対話システムの発話系列データを用いた性能評価手法
概要: 孤立発話に基づく情報検索を行うような音声認識システムとは異なり、複数発話によって何らかの課題を遂行する音声対話システムでは、音声認識システムの評価に用いられている単語正解精度や意味理解率以外にも様々な要因が音声対話システムの性能に影響している。従って総合的な性能評価指標として、アンケート調査によるユーザ満足度による評価や対話ログを用いた第三者による課題達成率の評価などが行われる。しかし、これらの評価指標を計測する手法を確立することは現在でも非常に重要かつ困難な課題である。 本講演では、孤立発話ではない複数発話であることに着目した性能評価指標の自動推定手法を概説する。特に、抽象化した発話系列のN-gramに着目した課題未達成の識別手法について紹介する。

講演者: Sakti Sakriani Watiasri
題目: Toward Recognizing Asian Spoken Languages
概要: More than 6800 living languages are spoken in the world today, one third are found in Asia. As globalization rapidly expands, multilingual speech recognition that can automatically recognize human spoken languages, become increasingly important. However, as every language has its own specific acoustic as well as linguistic, technologies developed based on models of one language cannot simply be ported “as-is” to other languages. In this talk, I will briefly describe the fundamental approach of automatic speech recognition, and discuss what the challenges in developing ASR systems for Asian languages. Finally, I will discuss what kind of special modeling techniques that can be applied to solve the problems.

講演者: 中島 悠太
題目: 背景推定に基づく人物のプライバシー保護
概要: モバイルカメラで撮影された映像には人物の容姿などのプライバシーに関わる情 報が含まれる。このため、映像をYouTubeなどの動画共有サービスに投稿する際 には、映像に対してモザイクや塗りつぶしなどのプライバシー保護処理が必要と なる。人物検出などの応用によりすべての人物に対してプライバシー保護処理を 適用する方法などが提案されているが、この方法では撮影意図が失われ、映像が 無意味なものになる可能性がある。本講演では、映像に含まれる人物を、撮影者 によって意図的に撮影された人物と偶然写り込んだ人物に識別する手法、及び撮 影された映像から人物に遮蔽された背景を推定する手法について概説し、これら の手法を利用した人物のプライバシー保護システムを紹介する。

ゼミナール I, II ページへ