混合オーディオオブジェクト信号の空間的圧縮符号化に関する研究

正時 啓輔 (0751109)


Spatial Audio Object Coding (SAOC)とは,現在標準化が行われている,ユーザーが各オーディオオブジェクトの定位感を自由に最適化できる圧縮技術である. しかし,従来のSAOCは,各オブジェクト信号が得られることが前提となっているため,実環境に多く存在するCD音楽やマイクロホンにて収録された混合信号を扱えない.また,SAOCの圧縮における基本原理であるBinaural Cue Coding (BCC)が持つ原理上避けられない音質劣化によって,SAOCにおいても同様に音質劣化が発生するという問題点がある.

本研究では,まずSAOCを,複数のオブジェクトが混合された入力信号に適用できるように拡張した構成を提案する.独立成分分析に基づくブラインド音源分離を用いた構成によって,各オブジェクト信号が得られない場合でも,有効に動作することが確認された.また,圧縮における音質劣化を改善するため,BCCよりも高音質かつ高圧縮な圧縮技術として,コサイン距離規範k-meansを用いた圧縮符号化法を提案する.この手法では,主要な定位方向を空間的に量子化することによって,圧縮歪を最小かつ高音質に圧縮を行うものである.客観評価,主観評価実験によりBCCとの比較を行い,提案手法が音質,伝送量の両面において非常に優れていることが示された.