GPU向けQCDライブラリQUDAのTCAアーキテクチャ実装の性能評価

  • 藤井久史
    筑波大学大学院システム情報工学研究科
  • 藤田典久
    筑波大学大学院システム情報工学研究科
  • 塙敏博
    東京大学情報基盤センター
  • 児玉祐悦
    筑波大学大学院システム情報工学研究科|筑波大学計算科学研究センター
  • 朴泰祐
    筑波大学大学院システム情報工学研究科|筑波大学計算科学研究センター
  • 佐藤三久
    筑波大学大学院システム情報工学研究科|筑波大学計算科学研究センター
  • 藏増嘉伸
    筑波大学計算科学研究センター
  • MikeClark
    NVIDIA Corporation

この論文をさがす

抄録

近年,HPC 分野で GPU などの演算加速装置を用いたクラスタの開発が盛んに行われている.このようなクラスタでは,ノード間をまたぐ演算加速装置間の通信を CPU に接続されたネットワークインターフェースを介して行う必要があるため,複数回のメモリコピー等によるオーバヘッドが発生してしまう.このためレイテンシが増加し,アプリケーションの性能を低下させてしまう.この問題に対する解決として,我々は GPU 間通信のレイテンシの改善を目的とした独自開発の密結合並列演算加速機構 TCA (Tightly Coupled Accelerators) の開発を行なっている.2013 年 10 月には TCA 実証システムである HA-PACS/TCA クラスタが筑波大学計算科学研究センターに導入された.本稿では,素粒子物理学のための GPU 向け格子量子色力学 (格子 QCD) ライブラリである "QUDA" に対し,TCA を適用した実装の性能評価を行う.

収録刊行物

キーワード

詳細情報 詳細情報について

  • CRID
    1573668927641355904
  • NII論文ID
    110009808138
  • NII書誌ID
    AN10463942
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ