ギガビットネットワークを用いた並列プロセスマイグレーションの性能評価 Performance Evaluations of Parallel Process Migration with a Giga - bit Network

この論文にアクセスする

この論文をさがす

著者

抄録

本論文は、ギガビットネットワークを用いたクラスタ上での、並列プロセスマイグレーションの実現方式と、PCクラスタ上での予備評価について述べる。実現には、著者らが既に開発したチェックポイント機構を応用する。チェックポイントでは、プロセスの状態をファイルに保存するのに対して、並列プロセスマイグレーションではネットワークを通じて移送するので、その性能はネットワークの転送性能に大きく依存する。並列プロセスマイグレーションでは、複数のノードが一斉に、それぞれ異なるノードにデータを転送する。これまでそのような通信パターンでの性能評価が得られていなかったので、実施した。その結果、ネットワークがボトルネックとなり、16以上のノードが同時にデータを転送する場合は、ノードあたり16MByte/sec程度であり、各ノードでローカルディスクにチェックポイントする場合の4-10倍の性能であることが判明した。This paper describes a parallel process migration technique for clusters with a giga-bit network and its preliminary evaluation on a PC cluster. The checkpointing technique proposed by the authors will be applied to the implementation. The performance of the parallel process migration substantially depends on the network bandwidth because the status of processes are transferred through the network in case of migration as opposed to they are stored in file(s) in case of checkpointing. In parallel process migration, more than one node transfer data at same time, and the destination node differs each other. Since no evaluation report was available on the network performance of clusters for such a communication pattern, authors have made it. The result shows that due to the network bottleneck, the bandwidth per node is about 16 MByte/sec when more than or equal to 16 nodes transfers data at same time. This performance is 4-10 times faster than the checkpointing in which the status of the processes are stored to the local disk at each node.

This paper describes a parallel process migration technique for clusters with a giga-bit network and its preliminary evaluation on a PC cluster. The checkpointing technique proposed by the authors will be applied to the implementation. The performance of the parallel process migration substantially depends on the network bandwidth because the status of processes are transferred through the network in case of migration as opposed to they are stored in file(s) in case of checkpointing. In parallel process migration, more than one node transfer data at same time, and the destination node differs each other. Since no evaluation report was available on the network performance of clusters for such a communication pattern, authors have made it. The result shows that due to the network bottleneck, the bandwidth per node is about 16 MByte/sec when more than or equal to 16 nodes transfers data at same time. This performance is 4-10 times faster than the checkpointing in which the status of the processes are stored to the local disk at each node.

収録刊行物

  • 情報処理学会研究報告システムソフトウェアとオペレーティング・システム(OS)

    情報処理学会研究報告システムソフトウェアとオペレーティング・システム(OS) 1999(65(1999-OS-082)), 81-88, 1999-08-02

    一般社団法人情報処理学会

参考文献:  12件中 1-12件 を表示

被引用文献:  1件中 1-1件 を表示

各種コード

  • NII論文ID(NAID)
    110002941325
  • NII書誌ID(NCID)
    AN10444176
  • 本文言語コード
    JPN
  • 資料種別
    Technical Report
  • ISSN
    09196072
  • NDL 記事登録ID
    5338621
  • NDL 雑誌分類
    ZM13(科学技術--科学技術一般--データ処理・計算機)
  • NDL 請求記号
    Z14-1121
  • データ提供元
    CJP書誌  CJP引用  NDL  NII-ELS  IPSJ 
ページトップへ