GPUアクセラレータと不揮発性メモリを考慮したI/O性能の予備評価 Preliminary I/O Performance Evaluation on GPU Accelerator and External Memory

この論文にアクセスする

この論文をさがす

著者

抄録

ペタ~ヨッタバイト級の大規模データを処理する需要が高まっており,近年のスーパーコンピュータには GPU や Xeon Phi などのメニーコアアクセラレータに加え,フラッシュメモリなどの不揮発性メモリも搭載されつつある.不揮発性メモリの中でも,複数枚の mini SATA SSD (mSATA SSD) を組み合わせて使用することにより,従来の SSD や PCI-E 接続型のフラッシュメモリに比べ大容量かつ高バンド幅,高 IOPS を実現できる可能性がある.しかし,複数枚の mSATA SSD とメニーコアアクセラレータを考慮した場合に I/O 性能を引き出す方法は明らかではない.I/O ベンチマークソフトウェアやデバイスメモリ容量を超える問題サイズのベンチマークアプリケーションを用いて,複数枚の mSATA SSD から GPU デバイスメモリへの I/O の方法を比較検討した.16 枚の mSATA SSD によるシーケンシャル I/O 性能において,Read バンド幅 7.69GB/s,Write バンド幅 3.75GB/s となることを確認した.また複数枚の mSATA SSD と GPU を用いた行列ベクトル積アプリケーションにおいて,RAID0 を組みストライプサイズを 1MB と設定することにより,8 枚の mSATA SSD から GPU へ 3.06GB/s のスループットで転送されることを確認し,Pinned メモリの使用や転送粒度も性能に大きく影響を与えることを確認した.Recent supercomputers deploy not only many-core accelerators such as GPU, Xeon Phi, but also Non-Volatile RAM such as flash memory as an external memory, in order to handle large-scale data processing for a wide range of applications. In particular, aggregating multiple mini SATA SSDs (mSATA SSDs) has potential to perform high bandwidth, high IOPS as well as large capacity. However, how to exploit I/O performance from multiple mSATA SSDs is not clear, especially when combining with many-core accelerators. In order to clarify I/O characteristics between GPU and multiple mSATA SSDs, we comparatively investigate I/O strategies on multiple mSATA SSDs and GPU. Our preliminary results exhibit that sequential read bandwidth is 7.69GB/s and write bandwidth is 3.8GB/s. Our results also exhibit 3.06GB/s of throughput from 8 mSATA SSDs to GPU by using RAID0 and setting stripe size to 1MB. Using pinned memory and data chunk size also affect data transfer performance significantly.

Recent supercomputers deploy not only many-core accelerators such as GPU, Xeon Phi, but also Non-Volatile RAM such as flash memory as an external memory, in order to handle large-scale data processing for a wide range of applications. In particular, aggregating multiple mini SATA SSDs (mSATA SSDs) has potential to perform high bandwidth, high IOPS as well as large capacity. However, how to exploit I/O performance from multiple mSATA SSDs is not clear, especially when combining with many-core accelerators. In order to clarify I/O characteristics between GPU and multiple mSATA SSDs, we comparatively investigate I/O strategies on multiple mSATA SSDs and GPU. Our preliminary results exhibit that sequential read bandwidth is 7.69GB/s and write bandwidth is 3.8GB/s. Our results also exhibit 3.06GB/s of throughput from 8 mSATA SSDs to GPU by using RAID0 and setting stripe size to 1MB. Using pinned memory and data chunk size also affect data transfer performance significantly.

収録刊行物

  • 研究報告ハイパフォーマンスコンピューティング(HPC)

    研究報告ハイパフォーマンスコンピューティング(HPC) 2013-HPC-141(1), 1-9, 2013-09-23

    一般社団法人情報処理学会

キーワード

各種コード

  • NII論文ID(NAID)
    110009606422
  • NII書誌ID(NCID)
    AN10463942
  • 本文言語コード
    JPN
  • 資料種別
    Technical Report
  • データ提供元
    NII-ELS  IPSJ 
ページトップへ