ドット文字を対象としたトップダウン型セグメンテーション手法の提案

溝口 拓也(1651102)


ドット文字とはドットマトリクスによって構成される文字であり,製品管理などに用いられる. コストや運用面などの観点から利用されるドット文字を,機械が自動で認識することができれば,産業界にとって大きな貢献となる.文字認識のタスクでは,一文字単位での入力画像を生成するのが一般的で,その前処理として個別に文字を切り出す工程が発生する. これまで文字が連結性を持つ一般的な文字に関する文字抽出・認識の研究は数多く行われてきた.しかし,ドット点が文字の最小構成要素となるドット文字では,文字の連結性や文字幅の情報を用いた従来の手法を適用させることが困難である. 本研究ではそのような特徴をもつドット文字に対して,ドット文字領域内を徐々に絞り込み,最終的には個別のドット文字を特定するトップダウン型セグメンテーション手法を提案する. 本研究では,工場における製造品に印字されたドット文字認識のアプリケーションを想定し,認識対象に対して視野があらかじめ分かっていることを前提とし,製品に対してある程度の位置まで,カメラの焦点を近接させることが可能である. 本研究では,そのような環境を想定して撮影した画像に対して,スーパーピクセルという呼ばれる小領域に分離する. 各スーパーピクセルに対して色の情報を用いて,文字・非文字領域に分割する.最終的には得られた微細な文字領域に対して濃度勾配を求め,文字・背景の勾配傾向を解析することで個別文字を切り出す.本研究では,これまでの研究において検証されなかった歪曲印字などの様々なドット文字に対して手法を適用し,性能を評価した.

研究内容