演算器アレイ型アクセラレータへのステンシルアプリケーションの写像と性能評価
林 大地 (1251085)
先行研究であるLAPP 上で浮動小数点演算プログラムを実行させる場合,
演算器とメモリ間のトポロジに関していくつかの課題が明らかになった.
本課題は主にLAPP が既存VLIW とのバイナリ互換性を維持していることに起因している.
このため,バイナリ互換性と引き替えに,浮動小数点演算プログラムを効率的に実行する
新たな構成のアクセラレータEMAX (Energy-aware Multimode Accelerator eXtension) を提案する.
まず,局所メモリを分散配置することにより,より多くの配列を参照するアプリケーションプログラムに対応した.
また,浮動小数点演算器を配置しやすい2 段パイプライン構造とすることにより,動作周波数も維持した.
さらに,横方向の配線数を削減するために構成の見直しを行った.
また,EMAX 上の演算器に対してアプリケーションを写像する際には,適切
な位置に命令を写像しなければデータを再利用できず,必要なデータを再度ロー
ドしなければならない.よって,ステンシルアプリケーションをEMAX で実行
するには,レジスタの依存関係以外の要素も考慮する必要がある.このため,演
算対象となるデータの再利用率を高める命令写像手法について検討した.アプリ
ケーションの命令写像においてデータの再利用率を考慮した場合としなかった場
合について,性能測定シミュレータにより必要なEMAX の行数とデータの再利
用率を測定し,データを再利用した場合には23%-66%の性能向上が図れることが分かった.
また,再利用率を考慮しない命令写像を行った場合と比較して7%33%の段数増加に留まるため,
データを可能な限り再利用する形で命令写像を行うことが望ましいことが分かった.