クラスタにおけるコンシステントチェックポイントの実現 A Consistent Checkpointing for Clusters

この論文にアクセスする

この論文をさがす

著者

抄録

本論文はクラスタのためのコンシステントチェックポイント(CCP)機構について述べるものである.本論文で提案するCCPは,ネットワークプリエンプションと呼ばれる並列プロセスのプロセス切替えの機構をCCPの無矛盾性の保証に応用し,また,CCPのスケーラビリティを確保する目的で,並列プロセスの状態をクラスタの各ノードが有するローカルディスクに出力するようにしたものである.NAS並列ベンチマークプログラムにより評価したところ,通常実行時のオーバヘッドはほとんどないことが確認できた.しかしローカルディスクの性能のバラツキにより,理想的なCCPのスケーラビリティは得られなかった.This paper describes a consistent checkpointing (CCP) technique forclusters.The proposed CCP uses a process switching mechanism ofparallel processes (called network preemption) to ensure thecheckpoint consistency.To obtain the scalability, local disk ofcluster node is used to save a snapshot of a parallel process.The proposed CCP is implemented and is evaluated using NAS parallelbenchmark programs.The evaluation results show that the CCP causesnegligible overhead at usual execution.But the ideal scalability ofcheckpointing cannot be obtained because the I/O performance of localdisks are widely scattered.

This paper describes a consistent checkpointing(CCP) technique for clusters. The proposed CCP uses a process switching mechanism of parallel processes(called network preemption)to ensure the checkpoint consistency. To obtain the scalability, local disk of cluster node is used to save a snapshot of a parallel process. The proposed CCP is implemented and is evaluated using NAS parallel benchmark programs. The evaluation results show that the CCP causes negligible overhead at usual execution. But the ideal scalability of checkpointing cannot be obtained because the I/O performance of local disks are widely scattered.

収録刊行物

  • 情報処理学会論文誌

    情報処理学会論文誌 41(6), 1697-1707, 2000-06-15

    一般社団法人情報処理学会

参考文献:  12件中 1-12件 を表示

各種コード

  • NII論文ID(NAID)
    110002725362
  • NII書誌ID(NCID)
    AN00116647
  • 本文言語コード
    JPN
  • 資料種別
    Journal Article
  • ISSN
    1882-7764
  • NDL 記事登録ID
    5370237
  • NDL 雑誌分類
    ZM13(科学技術--科学技術一般--データ処理・計算機)
  • NDL 請求記号
    Z14-741
  • データ提供元
    CJP書誌  NDL  NII-ELS  IPSJ 
ページトップへ