GPGPU処理系の自動最適化手法におけるシェアードメモリへのデータ転送方法の改良

書誌事項

タイトル別名
  • An Improved of Transferming Data of Shared Memory in GPGPU Programming Framework

この論文をさがす

抄録

近年,GPU 上で汎用計算を実行する GPGPU が注目されている.現在主流な開発環境である CUDA では,高級言語で記述することが可能だが,GPU の複雑なメモリ構造を意識してプログラミングする必要がある.これに対し,我々は単純なメモリ構造モデルでプログラミング可能な MESI-CUDA を提案している.しかし,現在の MESI-CUDA 処理系が生成するコードは最適化が不十分であり,手動最適化を施した CUDA コードと比べて実行時間が長くなることがある.一例として,GPU ではグローバルメモリの他,低容量だがアクセスレイテンシが短いシェアードメモリが複数存在し,手動最適化では両者を明示的に使い分ける.しかし従来の MESI-CUDA 実装ではグローバルメモリしか使用しない.そこで,我々は MESI-CUDA 上でシェアードメモリを用いるコードを自動生成する手法を開発している.本研究では,従来手法に対しシェアードメモリへのデータ転送部分の改良を行った.シェアードメモリへデータを転送する際,実行中のスレッドに合わせて格納するデータを入れ替えることでシェアードメモリの利用効率を向上させた.また,データを単純に分割して各シェアードメモリに格納するだけでなく,境界部分を重複して格納できるようにした.これにより従来手法では対応できなかったプログラムの最適化を可能としている.

収録刊行物

詳細情報 詳細情報について

  • CRID
    1570854177858863488
  • NII論文ID
    110009675720
  • NII書誌ID
    AN10463942
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ