京TofuにおけるMPI-3.0隣接集団通信の実装と評価 Implementation and Evaluation of MPI-3.0 Neighborhood Collectives in Tofu Interconnect

この論文にアクセスする

この論文をさがす

著者

    • 石川 裕 Yutaka Ishikawa
    • 理化学研究所計算科学研究機構|東京大学情報科学科 RIKEN Advanced Institute for Computational Science | Department of Computer Science, University of Tokyo

抄録

本発表では,京Tofuインターコネクトに最適化されたMPI隣接集団通信プリミティブの実装と評価について説明する.隣接集団通信プリミティブは袖通信のような,隣接プロセス間のデータ交換を最適化するために,MPI 3.0仕様で導入されている.このプリミティブによって与えられる通信パターンの事前知識に基いて,MPI_Neighbor_alltoallwを実装した.本実装では複数のRDMAエンジンおよびネットワークリンクを有するTofuインターコネクト用のRDMA転送スケジューラと組み合わせた.RDMA転送スケジューラはRDMAエンジン間の負荷不均衡およびネットワーク資源の競合を軽減するために設計されている.本発表では実際のアプリケーションに基いたベンチマークプログラムの評価結果から得られた重要なスケジューリングの課題と対策について説明する.In this presentation, we describe the implementation and evaluation results of MPI Neighborhood collective communication primitives in Tofu interconnect. These neighborhood primitives are introduced in MPI 3.0 specification to optimize data exchange among neighboring processes such as ghost region updates. Based on a priori knowledge regarding communication pattern given by a neighborhood primitive, we developed the MPI_Neighbor_alltoallw implementation combined with RDMA transfer scheduler for Tofu interconnect, which has multiple RDMA engines and network links. The RDMA transfer scheduler is designed to mitigate the load imbalance of RDMA engines and network resource contentions. We shows the major scheduling issues and its solutions obtained from the benchmark results based on real applications.

In this presentation, we describe the implementation and evaluation results of MPI Neighborhood collective communication primitives in Tofu interconnect. These neighborhood primitives are introduced in MPI 3.0 specification to optimize data exchange among neighboring processes such as ghost region updates. Based on a priori knowledge regarding communication pattern given by a neighborhood primitive, we developed the MPI_Neighbor_alltoallw implementation combined with RDMA transfer scheduler for Tofu interconnect, which has multiple RDMA engines and network links. The RDMA transfer scheduler is designed to mitigate the load imbalance of RDMA engines and network resource contentions. We shows the major scheduling issues and its solutions obtained from the benchmark results based on real applications.

収録刊行物

  • 情報処理学会論文誌プログラミング(PRO)

    情報処理学会論文誌プログラミング(PRO) 7(5), 21-21, 2014-12-05

    一般社団法人情報処理学会

キーワード

各種コード

  • NII論文ID(NAID)
    110009850864
  • NII書誌ID(NCID)
    AA11464814
  • 本文言語コード
    JPN
  • 資料種別
    Article
  • ISSN
    1882-7802
  • データ提供元
    NII-ELS  IPSJ 
ページトップへ