CUDA環境における高性能3次元FFT

書誌事項

タイトル別名
  • CUDA カンキョウ ニ オケル コウセイノウ 3ジゲン FFT
  • High Performance 3-D FFT in CUDA Environment

この論文をさがす

抄録

NVIDIAの最新GPUがサポートするCUDA環境では共有メモリを用いたスレッド間のデータ共有と,自由度が高いメモリアクセスが可能である.我々はこのCUDA環境に適した高性能3次元FFTアルゴリズムを提案する.GeForce 8シリーズのGPUを用いた3次元FFTにおいて,CUFFTライブラリ1.1と比較して3.1∼3.3倍,最大79.5GFLOPSの演算性能を達成した.

CUDA environment, which is supported in latest NVIDIA GPUs, allows data sharing between threads using shared memory, and also provides more flexible memory accesses. We propose a high performance 3-D FFT algorithm for the CUDA environment. Using GeForce 8 series GPUs, we achieved a high performance up to 79.5GFLOPS at 3-D FFT, which is from 3.1 to 3.3 times the performance compared with the performance of CUFFT library 1.1.

収録刊行物

被引用文献 (2)*注記

もっと見る

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ