GPUシステムにおける階層統合型粗粒度並列処理の並列化コンパイラ

この論文をさがす

抄録

GPUを搭載したマルチコアシステムにおいて,複数階層のマクロタスク(粗粒度タスク)を各コアに割り当てて並列実行を行う階層統合型粗粒度並列処理手法が提案されている.本手法では,処理時間の大きいマクロタスクの実行に対して,コアの代わりにGPUを使用し,プログラム全体の実行時間の短縮を目指す.本研究では,LLVM/Clangを用いた並列化コンパイラを開発しており,その並列化コンパイラを用いてCUDAを伴う並列Cコードを自動生成する.性能評価では,Tesla K80を搭載したXeonサーバ上で,粒子法とヤコビ法のプログラムに対して,並列化コンパイラにより生成した並列コードを用いて性能評価を行った結果,提案手法の有効性が確認された.

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ