GPGPU処理系の自動最適化手法におけるシェアードメモリへのデータ転送方法の改良

神谷 智晴, 丸山 剛寛, 大野 和彦

近年,GPU 上で汎用計算を実行する GPGPU が注目されている.現在主流な開発環境である CUDA では,高級言語で記述することが可能だが,GPU の複雑なメモリ構造を意識してプログラミングする必要がある.これに対し,我々は単純なメモリ構造モデルでプログラミング可能な MESI-CUDA を提案している.しかし,現在の MESI-CUDA 処理系が生成するコードは最適化が不十分であり,手動最適化を施した CUDA コードと比べて実行時間が長くなることがある.一例として,GPU ではグローバルメモリの他,低容量だがアクセスレイテンシが短いシェアードメモリが複数存在し,手動最適化では両者を明示的に使い分ける.しかし従来の MESI-CUDA 実装ではグローバルメモリしか使用しない.そこで,我々は MESI-CUDA 上でシェアードメモリを用いるコードを自動生成する手法を開発している.本研究では,従来手法に対しシェアードメモリへのデータ転送部分の改良を行った.シェアードメモリへデータを転送する際,実行中のスレッドに合わせて格納するデータを入れ替えることでシェアードメモリの利用効率を向上させた.また,データを単純に分割して各シェアードメモリに格納するだけでなく,境界部分を重複して格納できるようにした.これにより従来手法では対応できなかったプログラムの最適化を可能としている.

GPGPU処理系の自動最適化手法におけるシェアードメモリへのデータ転送方法の改良

書誌事項

この論文をさがす

抄録

収録刊行物

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

GPGPU処理系の自動最適化手法におけるシェアードメモリへのデータ転送方法の改良

書誌事項

この論文をさがす

抄録

収録刊行物

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

参加プロジェクトリスト

詳細情報詳細情報について