四種プロセッサからなるヘテロ型スーパーコンピュータにおける Linpack チューニング  [in Japanese] Linpack Tuning on a Heterogeneous Supercomputer with Four Types of Processors  [in Japanese]

Search this Article

Author(s)

Abstract

汎用プロセッサ二種とSIMD型アクセラレータ二種を備えたヘテロ型スパコンであるTSUBAMEにおけるLinpackベンチマークの実行について報告する.アクセラレータ型アーキテクチャは電力・設置面積を抑えつつ計算機システムの性能向上のために重要であるが,大規模並列計算を行った報告は筆者らの報告を除き依然少ない.TSUBAMEの約10000のOpteronコア,約500のXeonコア,約640基のClearSpeedアクセラレータ,約620基のNVIDIA Tesla GPUを全て用いたLinpack実行において,77TFlopsを達成した.この結果を得るためには,アクセラレータの性能を保持するためのプログラムの改変やチューニングが必要不可欠であった.なお今回の結果は最新Top500スパコンランキングに29位にランクされ,ヘテロ型システムとしては世界二位である.

We report Linpack benchmark results on the TSUBAME supercomputer, a large scale heterogenous system with two types of general processors and two types of accelerators. Although accelerator architectures are promising for performance improvement of computer systems while keeping power consumption and footprint low, there are only few reports about large scale computations on a large number of accelerators, except our previous trials. With all of about 10,000 Opteron cores, 500 Xeon cores, 640 ClearSpeed accelerators and 620 NVIDIA Tesla GPUs, we have achieved 77TFlops in Linpack. Keys for obtaining this result are modification to the program code and careful tuning that preserve performance of accelerators. With this result, TSUBAME is ranked as 29th in the latest Top500 supercomputer ranking, and it is the second largest heterogeneous system in the world.

Journal

  • IPSJ SIG Notes

    IPSJ SIG Notes 182, 13-18, 2009-02-19

    Information Processing Society of Japan (IPSJ)

References:  10

Codes

  • NII Article ID (NAID)
    110007133732
  • NII NACSIS-CAT ID (NCID)
    AN10096105
  • Text Lang
    JPN
  • Article Type
    ART
  • ISSN
    09196072
  • Data Source
    CJP  NII-ELS 
Page Top