本発表では,コンテンツ制作者が意図した一次音源の音像定位を保持した状態で,wave field synthesis (WFS) によって高い臨場感を得ることができるステレオコンテンツの再生が可能な音響システムの構築を目指し,一次音源情報の自動推定を行うアップミキサーを提案する.WFS により高臨場感再現が可能となった一方で,既存コンテンツにおいては WFS が必要とする情報 (一次音源情報) が縮退しているため,既存コンテンツをそのまま WFS で再生することはできない.一次音源情報を復元するための処理 (アップミキシング) 手法はいくつかあるが,スイートスポットが狭いという問題や,ユーザによる一次音源の空間配置の指定が必要となるため,コンテンツ本来の定位が崩れるという問題がある.
アップミキシングの既存手法の一つとして,channel-based アップミキサーがある.これは,WFS 等の物理的な臨場感再現手法 (物理音響モデルに基づく手法) により,ステレオ等の聴覚的な臨場感再現手法 (心理音響モデルに基づく手法) を疑似的に再現するためのアップミキサーである.そのため WFS の聴覚的な特性が重要となるが,WFSの聴覚的特性に関する議論は不十分であり,特に,特殊な音源 (焦点音源) 生成時における音像深度知覚特性に関する議論はなされていない.そこで,本発表ではまず,WFS による焦点音源再現時における音像深度知覚特性を明らかにする.まず,WFS を実環境において実現するためのシステム構築を行う.次に,計算機上においてシミュレーションを行い,WFS により再現される音場の計算を行う.さらに,構築されたシステムを用いて再現された音場と,計算された音場の比較を行って,本実験環境において音場再現が可能であることを示す.最後に,WFS により再現された音場に対し,音像深度知覚に関する主観評価実験を行い,WFS による音場再現時の聴覚的特性を明らかにする.
一方,channel-based アップミキサーは心理音響モデルに基づく手法であるため,物理音響モデルに基づく手法と比べて,スイートスポットが狭いという問題がある.そのため,物理音響モデルに基づく手法を実現するためのアップミキサーも研究されており,これを object-based アップミキサーと呼ぶ.しかし,既存 object-based アップミキサーでは,ユーザによる空間配置の指定が必要となる.そこで,本発表では,一次音源のスペクトル情報及び一次音源の方位情報を同時推定可能な方位クラスタリングに基づくオーディオオブジェクト推定法に注目し,得られた一次音源の方位情報から vector-based amplitude panningによって空間情報を推定することで,WFS に必要な一次音源情報の自動推定を行うアップミキサーを提案する.まず,提案法による空間配置推定精度を評価し,提案法による一次音源情報推定が可能であることを示す.最後に,提案法と channel-based アップミキサーを用いた WFS による音場再現を行い,複数受聴位置において音像方位知覚に関する主観評価実験を行い,提案法の有効性を示す.