メモリインテンシブアレイアクセラレータを用いた畳み込みニューラルネットワーク処理

田ノ元 正和 (1351066)


近年,畳み込みニューラルネットワーク(CNN)を用いた画像認識が,認識精度の高さから注目される. 一方でCNNは処理の大半を占める畳み込み演算における実行時間や電力消費の削減が課題である.従来高速化に用いられるGPUでは,畳み込み演算一回あたりの計算量が十分大きくない場合,メモリアクセスや前処理のオーバヘッドが隠蔽できず性能が低下する.

本発表では,畳み込み演算の計算量が小さい場合にも効果的な高速化として,メモリを分散配置したCGRAによる実行手法を提案する.効率的なスケジューリングによってメモリ転送のオーバヘッドを最小限に抑えつつ,演算器アレイによる畳み込み演算を行う.またハードウェアで実現する機能を最小限とし,命令マッピングの変更のみで順伝播と誤差逆伝播両方の畳み込み演算を実行可能とする.規模が異なるCNNをベンチマークとして提案手法の評価を行った結果,畳み込み演算の計算量が小さい10クラス分類の画像認識や数字認識において,提案手法は組み込み向けGPUに比べて3.2倍から4.5倍の面積あたり性能かつ1.4倍から1.8倍の電力あたり性能となった.