短区間ピーク周波数推定法とピーククラスタリングを用いた連続楽音における音高抽出

福井勝宏 (0251203)


自動採譜を実現するための不可欠な技術の一つとして音高抽出があり,近年,研究が盛んに行われている.その研究の一環として,基本となる楽音の主要構成要素である音高についての自動抽出の研究が行われている.音高抽出システムの多くは,周波数分析におけるフレーム長がフレームシフト間隔と比べて非常に多くの標本点数を必要とするため,ピーク周波数の急激な変化に対処することは難しい.そのため,従来の音高抽出では,過渡部のような音の変り目での正確な音高抽出が困難である.本研究では,過渡部でも適切に音高を同定すべく,パワースペクトルのピーク抽出を行ったのちに,過渡部のピーク周波数を推定する手法,短区間ピーク周波数推定法(Short-Term Estimation Method for Peak Frequencies : STEMPF)を新たに提案する.さらにもう一つの提案手法,ピーククラスタリングを用いることで,楽音を示す真のローカルピークのみに着目した頑健な音高抽出を実現する.spectrum distortion による実験の結果,提案手法では約 2.3 dB の改善が得られ,また,従来手法よりも良好な抽出率を得られることが分かった.