超並列準汎用計算機GRAPE-DRによる重力多体問題シミュレーションおよびLU分解 Gravitational N-body simulation and LU decomposition with the multi purpose accelerator GRAPE-DR

この論文にアクセスする

この論文をさがす

著者

抄録

超並列準汎用計算機 GRAPE-DR は 1 チップに 512 個の演算要素を搭載した SIMD アクセラレータを PC に接続し,これを並列に接続したクラスタシステムである.これは従来の重力多体問題専用計算機 GRAPE の発展形として使用できるように構想されたものであるが,アクセラレータ部分が専用ハードウェアパイプラインではなくプログラム可能な演算器を搭載することでより広い応用が可能であることが大きな特徴である.本論文ではアクセラレータ部で動作する重力相互作用計算と行列積計算ルーチンを実装し,1 ノードでの性能評価をおこなった.現在それぞれのライブラリについて最適化を行っている.現状では重力相互作用計算では 362.6 GFlops (N = 262144),行列積計算では 635.1GFlops (M = N = 32768,K = 2048) の演算性能となった.これを用いて High Performance LINPACK (HPL) の加速を行い,演算性能値は 284.3 GFlops (N = 34816,NB = 2048) となった.The multi purpose computer GRAPE-DR is a cluster of PCs computer with the custom-made SIMD accelerator. It was designed as a for the successor of the special purpose computers for N-body simulation, "GRAPE" systems. The GRAPE-DR chip consists of 512 simplified processor cores. It can be used for wider applications than the range of applications of previous GRAPE systems. We implemented libraries for gravitational N-body simulations and matrixmatrix multiplications(DGEMM) on the GRAPE-DR system, we report the performance of these libraries as of the end of June 2009. we evaluated performances of these libraries on a single PC with a GRAPE-DR accelerator card. The mesared performance was 362.6GFlops(N = 262144) for the gravitational N-body simulations. and it has achieved and 635.1GFlops for the matrix-matrix multiplications(M = N = 32768, K = 2048). The performance of LU-decompositions was 284.3GFlops on High Performance LINPACK (N = 34816, NB = 2048).

収録刊行物

  • 研究報告計算機アーキテクチャ(ARC)

    研究報告計算機アーキテクチャ(ARC) 2009-ARC-184(26), 1-11, 2009-07-28

    情報処理学会

参考文献:  10件中 1-10件 を表示

各種コード

  • NII論文ID(NAID)
    110007997579
  • NII書誌ID(NCID)
    AN10096105
  • 本文言語コード
    JPN
  • 資料種別
    Technical Report
  • ISSN
    09196072
  • NDL 記事登録ID
    024767712
  • NDL 請求記号
    YH247-911
  • データ提供元
    CJP書誌  NDL  NII-ELS  IPSJ 
ページトップへ