GPGPU処理系の自動最適化手法におけるシェアードメモリへのデータ転送方法の改良
書誌事項
- タイトル別名
-
- An Improved of Transferming Data of Shared Memory in GPGPU Programming Framework
この論文をさがす
抄録
近年,GPU 上で汎用計算を実行する GPGPU が注目されている.現在主流な開発環境である CUDA では,高級言語で記述することが可能だが,GPU の複雑なメモリ構造を意識してプログラミングする必要がある.これに対し,我々は単純なメモリ構造モデルでプログラミング可能な MESI-CUDA を提案している.しかし,現在の MESI-CUDA 処理系が生成するコードは最適化が不十分であり,手動最適化を施した CUDA コードと比べて実行時間が長くなることがある.一例として,GPU ではグローバルメモリの他,低容量だがアクセスレイテンシが短いシェアードメモリが複数存在し,手動最適化では両者を明示的に使い分ける.しかし従来の MESI-CUDA 実装ではグローバルメモリしか使用しない.そこで,我々は MESI-CUDA 上でシェアードメモリを用いるコードを自動生成する手法を開発している.本研究では,従来手法に対しシェアードメモリへのデータ転送部分の改良を行った.シェアードメモリへデータを転送する際,実行中のスレッドに合わせて格納するデータを入れ替えることでシェアードメモリの利用効率を向上させた.また,データを単純に分割して各シェアードメモリに格納するだけでなく,境界部分を重複して格納できるようにした.これにより従来手法では対応できなかったプログラムの最適化を可能としている.
収録刊行物
-
- 情報処理学会研究報告. [ハイパフォーマンスコンピューティング]
-
情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 2014 (6), 1-10, 2014-02-24
一般社団法人情報処理学会
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1570854177858863488
-
- NII論文ID
- 110009675720
-
- NII書誌ID
- AN10463942
-
- 本文言語コード
- ja
-
- データソース種別
-
- CiNii Articles