反復法ライブラリ向け4倍精度演算の実装とSSE2を用いた高速化 Implementation of Fast Quad Precision Operation and Acceleration with SSE2 for Iterative Solver Library

この論文にアクセスする

この論文をさがす

抄録

CG法等のクリロフ部分空間法の収束性は丸め誤差に大きく影響される.収束の改善を図るには高精度演算が有効であるが計算時間が多くかかってしまう.我々は,反復解法ライブラリLisにdouble-double精度を用いた4倍精度演算を実装し,SSE2 SIMD命令を用いて高速化を行った.SSE2に対して2段のループアンローリング等の高速化手法を適用し,計算時間は倍精度演算の約3.5倍,FORTRAN REAL*16の0.2倍程度となった.さらに,計算時間短縮のため反復解法中で必要なときだけ4倍精度演算を利用するDQ-SWITCHアルゴリズムを提案した.数値実験からDQ-SWITCHは適切なリスタート基準を決定できれば計算時間を短縮できることを示した.The convergence of Krylov subspace methods, including CG method etc., are much influenced by the rounding errors. The high precision operation is effective for the improvement of convergence, however the arithmetic operations are costly. In this paper, we implemented the quadruple precision operations using the double-double precision for itaretive solver library Lis, and accelerated by using the SSE2 SIMD instruction. For speed-up of SSE2, we applied a loop unrolling etc.. The computation time of our implementation is 3.5 times as long as the Lis double precision, and is 0.2 times as long as FORTRAN REAL*16. Furthermore, we propose a DQ-SWITCH algorithm that efficiently uses the quadruple precision operations in order to reduce the computation time. The proposed method is shown to reduce computation time by numerical experiments.

収録刊行物

  • 情報処理学会論文誌コンピューティングシステム(ACS)

    情報処理学会論文誌コンピューティングシステム(ACS) 1(1), 73-84, 2008-06-26

    情報処理学会

被引用文献:  3件中 1-3件 を表示

各種コード

  • NII論文ID(NAID)
    110007990157
  • NII書誌ID(NCID)
    AA11833852
  • 本文言語コード
    JPN
  • 資料種別
    Article
  • ISSN
    1882-7829
  • NDL 記事登録ID
    024349360
  • NDL 請求記号
    YH247-812
  • データ提供元
    CJP引用  NDL  NII-ELS  IPSJ 
ページトップへ