Performance Evaluation of a 3D-Stencil Library for Distributed Memory Array Accelerators
稲垣 慶和 (1261201)
発表梗概
本論文では、内部に小規模なメモリを分散配置してデータ移動を最小限に抑えたメモリ分散型アレイ型アクセラレータ(Energy-aware Multimode Accelerator eXtension : EMAX) をターゲットとした3Dステンシル演算ライブラリの命令、データ配置最適化手法と、その性能評価結果について述べる。
第1章は序論であり、画像処理、3次元シミュレーション、科学技術演算などの性能向上に向けたハードウェア、ソフトウェアによる研究動向と、その評価ベンチマークについて述べる。
第2章では関連研究、当研究室における先行研究について述べる。
第3章では本研究で提案するライブラリがターゲットとする三次元ステンシル演算について説明する。
第4章では提案ライブラリがサポート対象とするEMAXのシステム構成、命令セットについて述べる。
第5章では提案ライブラリのユーザインタフェース、EMAXへの命令マッピング手法について述べる。EMAXの演算性能を最大限利用するためには、ホストPCとEMAX間のデータ転送量を削減することが重要なファクタとなる。提案ライブラリによる命令並列マッピング手法について述べ、そのデータ転送量削減効果を明らかにする。
第6章では、EMAXの実行シミュレーションモデルと、そのシミュレータを使用した提案ライブラリの評価結果について述べる。提案ライブラリによる命令並列マッピング手法適用時の三次元ステンシル演算実行時間を測定し、ハンドチューンで命令マッピングした実行時間と比較し最大90%実行時間を削減できることを示した。また汎用プロセッサによる三次元ステンシル演算の実行時間と比較し、提案ライブラリを使用したEMAXでは実行時間を23%削減することを示した。
第7は結論であり、本研究で得られた結果の総括を行う。