エッジ方向成分射影法による多値文字画像からの特徴抽出

吉村 浩至 (9851129)


本研究発表では,Gaborフィルタを用いたエッジ方向成分射影による 多値文字パターン認識手法について述べる.
 ビデオ映像中のテロップや自然画像中の文字は, スキャナで読み取った文書画像に比べて 低解像度であるため,従来行われてきた2値画像からの認識の場合, 2値化による情報量の低下により認識が困難になる. また映像内から文字切り出しの際,ノイズによる位置ずれによる認識率低下の問題も考えられる. そこで本手法は,多値文字画像に適用したGaborフィルタの出力結果を 局所領域内で累積することにより, 低解像文字に対しても有効で,位置ずれに頑健な特徴抽出を可能にする.
 本手法を映画字幕認識に適用し,低解像度文字に対して認識実験を行った. まず従来の2値化による文字認識手法との比較実験を行うことにより, 低解像度文字に対する多値画像からの文字認識の有効性を示す. 次に本手法の低解像度文字に対する認識性能を検証する. 最後に位置ずれが生じた文字画像に対しても認識実験について述べ, 位置ずれに対してどの程度頑健であるかを示す.