分散共有メモリを用いた疎行列アルゴリズムの細粒度並列処理とその最適化  [in Japanese] Fine Grain Parallel Implementation of Sparse Matrix Algorithms and its Optimization  [in Japanese]

Search this Article

Author(s)

    • 西田 晃 NISHIDA AKIRA
    • 東京大学大学院 情報理工学系研究科 コンピューター科学専攻 Department of Computer Science, the University of Tokyo
    • 額田 彰 NUKADA AKIRA
    • 東京大学大学院 情報理工学系研究科 コンピューター科学専攻 DDepartment of Computer Science, the University of Tokyo
    • 小柳 義夫 OYANAGI YOSHIO
    • 東京大学大学院 情報理工学系研究科 コンピューター科学専攻 Department of Computer Science, the University of Tokyo

Abstract

本研究では,コモディティハードウェアによって構成された分散共有メモリ型アーキテクチャを採用することにより,容易に資源の拡張が可能な計算機環境を実現することを目標とするとともに,ユーザが共有メモリアーキテクチャの下位構造を意識することなく高性能な科学技術演算を行なうことのできる計算環境の構築を目指している.本稿では,そのための予備評価としてNEC Itanium ccNUMAサーバ上に実装されたLinuxシステムを利用し,疎行列アルゴリズムの細粒度な実装方式とその最適化手法について,実機上での評価結果をもとに考察を行った.SGI Origin 2000との比較の結果,商用機の利用に際しては,メモリ帯域幅の確保に注意する必要のあることが明らかとなった.

In this study, we target a commodity NUMA computing environment which enables users to realize high performance scalable scientific computing without thinking the details of its architecture. As a preliminary evaluation, we discuss in this paper the implementation of sparse matrix algorithms and its optimization on Linux environment implemented on an NEC Itanium based ccNUMA server. The comparative study with SGI Origin 2000 shows that we have to be aware of sustained memory bandwidth to construct high performance commodity NUMA environments.

Journal

  • IPSJ SIG Notes

    IPSJ SIG Notes 91, 37-42, 2002-08-21

    Information Processing Society of Japan (IPSJ)

References:  11

Codes

  • NII Article ID (NAID)
    110002952943
  • NII NACSIS-CAT ID (NCID)
    AN10463942
  • Text Lang
    JPN
  • Article Type
    ART
  • ISSN
    0919-6072
  • NDL Article ID
    6292786
  • NDL Call No.
    Z14-1121
  • Data Source
    CJP  NDL  NII-ELS 
Page Top