京TofuにおけるMPI-3.0隣接集団通信の実装と評価

書誌事項

タイトル別名
  • Implementation and Evaluation of MPI-3.0 Neighborhood Collectives in Tofu Interconnect

この論文をさがす

抄録

本発表では,京Tofuインターコネクトに最適化されたMPI隣接集団通信プリミティブの実装と評価について説明する.隣接集団通信プリミティブは袖通信のような,隣接プロセス間のデータ交換を最適化するために,MPI 3.0仕様で導入されている.このプリミティブによって与えられる通信パターンの事前知識に基いて,MPI_Neighbor_alltoallwを実装した.本実装では複数のRDMAエンジンおよびネットワークリンクを有するTofuインターコネクト用のRDMA転送スケジューラと組み合わせた.RDMA転送スケジューラはRDMAエンジン間の負荷不均衡およびネットワーク資源の競合を軽減するために設計されている.本発表では実際のアプリケーションに基いたベンチマークプログラムの評価結果から得られた重要なスケジューリングの課題と対策について説明する.

In this presentation, we describe the implementation and evaluation results of MPI Neighborhood collective communication primitives in Tofu interconnect. These neighborhood primitives are introduced in MPI 3.0 specification to optimize data exchange among neighboring processes such as ghost region updates. Based on a priori knowledge regarding communication pattern given by a neighborhood primitive, we developed the MPI_Neighbor_alltoallw implementation combined with RDMA transfer scheduler for Tofu interconnect, which has multiple RDMA engines and network links. The RDMA transfer scheduler is designed to mitigate the load imbalance of RDMA engines and network resource contentions. We shows the major scheduling issues and its solutions obtained from the benchmark results based on real applications.

収録刊行物

キーワード

詳細情報 詳細情報について

  • CRID
    1050845762835789312
  • NII論文ID
    110009850864
  • NII書誌ID
    AA11464814
  • ISSN
    18827802
  • Web Site
    http://id.nii.ac.jp/1001/00107321/
  • 本文言語コード
    ja
  • 資料種別
    article
  • データソース種別
    • IRDB
    • CiNii Articles

問題の指摘

ページトップへ