ステンシルアプリケーションおよびグラフ処理のためのメモリインテンシブアレイアクセラレータの開発と評価

清水 怜 (1351056)


近年,ステンシルアプリケーションなどの規則的な演算だけでなく,メモリ参 照パターンが不規則なグラフ処理が注目されており,双方のアプリケーションが 効率的に実行されるシステムが求められている.グラフ処理は,複雑なメモリ参 照パターンを持ち,内在する並列性の粒度が入力グラフによって大きく変化する ため,これまでのマルチコアCPUやGPUが本来もつ最大性能を活用することが 困難であることが知られている.そこで,プログラムにおける最内ループの命令 列をパイプライン実行することで,細粒度の並列性を活用するデータフロー実行 モデルが注目されつつある.本研究では,グラフ処理アプリケーションの1 つで あるTriangle Counting について,多数の演算器と演算器毎のローカルメモリで構 成されるメモリインテンシブアレイアクセラレータを用いた高速化方式を提案す る.アレイアクセラレータを多バンク化されたメインメモリへ直接接続するとと もに,各メインメモリに対して細粒度の読み書きを行うトランザクションユニッ トを組み合わせることによって,一定のサイクル数で処理が完了しないメインメ モリアクセス,ハッシュ表検索,Read-Modify-Write 機能を実現する.実LSI を 用いてステンシルアプリケーションの評価を行った結果,GeForce GTX 780 に対 してピークメモリバンド幅あたりで最大3.44 倍の性能を達成できることを確認し た.一方,ソフトウェアシミュレータ用いてグラフ処理の評価を行った結果,動 作周波数200MHz 程度のアレイアクセラレータとトランザクションユニットの連 携により,512KB 程度のキャッシュを備える動作周波数2.4GHz の一般的なCPU に対して最大3.86 倍の性能を達成できることを確認できた.