分散メモリ向け並列言語XcalableMPコンパイラの実装と性能評価  [in Japanese] Implementation and Performance Evaluation of XcalableMP: A Parallel Programming Language for Distributed Memory System  [in Japanese]

    • 李 珍泌 Jinpil Lee
    • 筑波大学大学院システム情報工学研究科 Graduate School of Systems and Information Engineering, University of Tsukuba
    • 朴 泰祐 Taisuke Boku
    • 筑波大学大学院システム情報工学研究科|筑波大学計算科学研究センター Graduate School of Systems and Information Engineering, University of Tsukuba | Center for Computational Sciences, University of Tsukuba
    • 佐藤 三久 Mitsuhisa Sato
    • 筑波大学大学院システム情報工学研究科|筑波大学計算科学研究センター Graduate School of Systems and Information Engineering, University of Tsukuba | Center for Computational Sciences, University of Tsukuba

Access this Article

  • IPSJ

Search this Article

Abstract

分散メモリ型並列計算機における標準的なプログラミングモデルであるMPIは高いプログラミングコストが問題として指摘されている.並列プログラミングをより簡単にするため,CとFortranをベース言語として,指示文により拡張した並列プログラミングモデルXcalableMPが提案されている.XcalableMPはOpenMP-likeな指示文を提供し,典型的なデータ並列化手法が有効なアプリケーションに対して逐次コードからのシームレスな並列化を可能にする.また,CAF-likeな言語拡張を取り入れることにより,ノード内のメモリイメージとノード間通信を意識した効率的な並列化の記述が可能である.また,性能チューニングのため,OpenMPやMPIをXcalableMPと併用することもできる.本論文では,XcalableMPについて述べ,そのコンパイラの実装と性能評価について述べる.性能評価にはHPC Challenge Benchmarkの並列化を行い,XcalableMPが少ないプログラミングコストで分散メモリ向け並列性記述を実現できることを確認した.

Although MPI is a de-facto standard for parallel programming on distributed memory systems, writing MPI programs is often a time-consuming and complicated process. XcalableMP is a language extension of C and Frotran for parallel programming on distributed memory systems that helps users to reduce those programming efforts. XcalableMP provides two programming models. The first one is the global view model, which supports typical parallelization based on the data and task parallel paradigm, and enables parallelizing the original sequential code using minimal modification with simple, OpenMP-like directives. The other one is the local view model, which allows to use CAF-like expression to describe internode communications. Users can even use MPI and OpenMP explicitly in our language to optimize the performance explicitly. In this paper, we introduce XcalableMP, the implementation of the compiler, and the performance evaluation result by global view parallelization in XcalableMP. For the performance evaluation, we parallelized HPC Challenge Benchmark in XcalableMP. It shows that users can describe the parallelization for distributed memory system with a small modification to the original sequential code.

Journal

情報処理学会論文誌. コンピューティングシステム   [List of Volumes]

情報処理学会論文誌. コンピューティングシステム 3(3), 153-165, 2010-09-17  [Table of Contents]

Information Processing Society of Japan (IPSJ)

Cited by:  1

You must have a user ID to see the cited references.If you already have a user ID, please click "Login" to access the info.New users can click "Sign Up" to register for an user ID.

Keywords

Codes

  • NII Article ID (NAID) :
    110007990316
  • NII NACSIS-CAT ID (NCID) :
    AA11833852
  • Text Lang :
    JPN
  • Article Type :
    Journal Article
  • ISSN :
    03875806
  • NDL Article ID :
    024301544
  • NDL Call No. :
    YH247-812
  • Databases :
    CJPref  NDL  NII-ELS