實本 英之 JITSUMOTO HIDEYUKI

Articles:  1-20 of 27

  • 1 / 2
  • MH-QEMU: Memory-State-Aware Fault Injection Platform

    實本 英之 , JITSUMOTO HIDEYUKI , 小林 佑矢 , Kobayashi Yuya , 野村 哲弘 , Nomura Akihiro , 松岡 聡 , MATSUOKA SATOSHI

    As we move towards higher-density, larger-scale, and lowerpowercomputing hardware, new types of failures are being experiencedwith increasing frequency. Hardware designed for the post-Moore generation

    Supercomputing Frontiers. SCFA 2019. Lecture Notes in Computer Science (11416), 71-85, 2019-04

    IR 

  • MH-QEMU: Memory-State-Aware Fault Injection Platform

    實本 英之 , JITSUMOTO HIDEYUKI , 小林 佑矢 , Kobayashi Yuya , 野村 哲弘 , Nomura Akihiro , 松岡 聡 , MATSUOKA SATOSHI

    As we move towards higher-density, larger-scale, and lowerpowercomputing hardware, new types of failures are being experiencedwith increasing frequency. Hardware designed for the post-Moore generation …

    Supercomputing Frontiers. SCFA 2019. Lecture Notes in Computer Science (11416), 71-85, 2019-04

    IR 

  • Overview of TSUBAME3.0, Green Cloud Supercomputer for Convergence of HPC, AI and Big-Data  [in Japanese]

    松岡 聡 , 遠藤 敏夫 , 額田 彰 , 三浦 信一 , 野村 哲弘 , 佐藤 仁 , 實本 英之 , Drozd Aleksandr

    Tsubame ESJ. : e-science journal 16, 2-8, 2017-11

  • The Framework for Jointing Computation Center with User-Level Management System  [in Japanese]

    JITSUMOTO Hideyuki , KOBAYASHI Taizo , MATSUMOTO Masaharu , TAKIZAWA Shinichiro , MIURA Shinichi , NAKAJIMA Kengo

    科学技術シミュレーションの分野において、大規模化あるいは、より複雑な物理現象を解明すべく、複数のアプリケーションを組み合わせて利用する連成計算は今後必要不可欠な実行シナリオとなっている。また、大規模な計算機資源を持つ拠点も増えてきており、これをシームレスに使うことを目指したインフラも現れてきている。連成計算の実行シナリオを有効に利用することによって、複数のアプリケーションを多拠点に配置し、より大規 …

    IEICE technical report. Computer systems 114(155), 155-159, 2014-07-28

  • HPCI先端ソフトウェア運用基盤の構築と運用  [in Japanese]

    三浦信一 , 滝澤真一朗 , 松岡聡 , 棟朝雅晴 , 實本英之 , 小林泰三

    平成 24 年度より運用が開始されている HPCI では,スーパコンピュータ 「京」 や基盤センター群が保有するスーパコンピュータ間の認証基盤統一,データ共有を実現している.しかしながら,既存のスーパコンピュータシステムはバッチキューでジョブ管理されていることや,計算ノードでの管理者権限がないため,OS や分散システムの研究開発を行う CS 系ユーザの利用環境条件を満たさない.また,インターネット …

    IPSJ SIG Notes 2014-HPC-143(30), 1-6, 2014-02-24

  • 適切なチェックポイン卜周期を与えるアプリケーションレベルチェックポイントライブラリ  [in Japanese]

    實本英之 , 鴨志田良和

    多くの科学技術計算において、定期的なチェックポイントファイルの出力は一般的になっている。しかし、この周期に関してはアプリケーションプログラマが経験即を元に決めていることが多く、適切なものにはなっていない。適切なチェックポイント周期は、故障率、チェックポイント時間、I/O 帯域によって決定されるが、これらの情報は実行環境に依存するもので、実行時の情報取得が必要となる。このため、外部から与えられる最適 …

    IPSJ SIG Notes 2013-HPC-139(10), 1-7, 2013-05-22

  • Fault Tolerance Framework to Improve Partial Message Logging  [in Japanese]

    轟 侑樹 , 實本 英之 , 佐藤 三久 , 石川 裕

    近年のスーパーコンピュータにおけるノード数は近年ますます増加の一途をたどっている.それに伴い HPC システムにおける故障間隔は無視できない程に短くなり,長時間かかるアプリケーションの実行などにおいてはそれが深刻な問題になり得る.そしてその問題を解決するための耐故障性実現機構として連携チェックポインティングやメッセージロギング方式が提案されている.しかし,連携チェックポインティングでは故障発生時に …

    研究報告ハイパフォーマンスコンピューティング(HPC) 2012-HPC-137(17), 1-6, 2012-12-06

  • Fault Tolerance Framework to Improve Partial Message Logging  [in Japanese]

    轟 侑樹 , 實本 英之 , 佐藤 三久 , 石川 裕

    近年のスーパーコンピュータにおけるノード数は近年ますます増加の一途をたどっている.それに伴い HPC システムにおける故障間隔は無視できない程に短くなり,長時間かかるアプリケーションの実行などにおいてはそれが深刻な問題になり得る.そしてその問題を解決するための耐故障性実現機構として連携チェックポインティングやメッセージロギング方式が提案されている.しかし,連携チェックポインティングでは故障発生時に …

    研究報告計算機アーキテクチャ(ARC) 2012-ARC-202(17), 1-6, 2012-12-06

  • 通信オーバーラップを考慮したアプリケーションレベルチェックポイントフレームワーク  [in Japanese]

    JITSUMOTO Hideyuki

    大規模HPC環境では、要素数の増加や、高密度低電力実装の影響により、システムの故障率は大きく増加しており、アプリケーションを実行するに当たり、故障対応が必須要件になっている。故障対応アルゴリズムのコストを極限まで削減するためには、アプリケーション毎に適したアルゴリズムを適用することが重要である。故障対応アルゴリズムの一つであるチェックポイント/リスタートもアプリケーションからのアドバイスを用いるこ …

    IEICE technical report. Dependable computing 112(174), 1-5, 2012-07-27

    References (4)

  • Performance Evaluation of HITACHI SR16000 model M1 Supercomputer System  [in Japanese]

    大島 聡史 , 實本 英之 , 鴨志田 良和 , 片桐 孝洋 , 田浦 健次朗 , 中島 研吾

    本稿では東京大学情報基盤センターにおいて 2011 年 10 月に稼働を開始したスーパーコンピューターシステム HITACHI SR16000 モデル M1(愛称 Yayoi) の性能について報告する.本システムは計算ノードに Power7 プロセッサを搭載した最新のスーパーコンピューターシステムである.いくつかのベンチマークを用いて性能評価を行った結果,性能の特性や重要な実行時環境変数の設定など …

    研究報告ハイパフォーマンスコンピューティング(HPC) 2012-HPC-133(5), 1-10, 2012-03-19

  • 並列スーパーコンピュータSR16000/M1の構成と性能  [in Japanese]

    大島聡史 , 實本英之 , 鴨志田良和 , 片桐孝洋 , 田浦健次朗 , 中島研吾

    ハイパフォーマンスコンピューティングと計算科学シンポジウム論文集 (2012), 84-84, 2012-01-17

    IPSJ 

  • Design of Advanced Software Deployment Infrastructure in HPCI Wide-area Distributed Environment  [in Japanese]

    滝澤 真一朗 , 棟朝 雅晴 , 宇野 篤也 , 小林 泰三 , 實本 英之 , 松岡 聡 , 石川 裕

    平成24年秋の運用開始が予定されているHPCIではHPC研究者がスーパーコンピュータ「京」を有効活用することの支援を目的とし,京と基盤センター群が保有するスーパーコンピュータ間の認証基盤統一,データ共有の実現から開始する.しかしながら,スーパーコンピュータはバッチキューでジョブ管理されていることや,計算ノードでの管理者権限がないため,OSや分散システムの研究を行うHPC研究者向けの利用環境条件を満 …

    研究報告ハイパフォーマンスコンピューティング(HPC) 2011-HPC-130(68), 1-7, 2011-07-20

  • Design Overview of System Software and Shared Global Storage in HPCI Wide Area Distributed Environment  [in Japanese]

    實本 英之 , 建部 修見 , 佐藤 仁 , 石川 裕

    大規模スパコンである 「京」 とその他国内主要な計算資源をユーザが容易に利用できる環境として、革新的ハイパフォーマンス・コンピューティング・インフラ (HPCI) を構築する。基本設計は、ネットワーク、認証基盤、共有ストレージ、ユーザ管理支援、先端ソフトウェア運用基盤に分けて構成され、このうちの共有ストレージについて詳細に紹介する。共有ストレージは、HPCI 各拠点から利用可能な大容量、高信頼、高 …

    研究報告ハイパフォーマンスコンピューティング(HPC) 2011-HPC-130(67), 1-6, 2011-07-20

  • Toward a Fault Resilient Environment with a Simple Coding for Application Programmers  [in Japanese]

    實本 英之 , 石川 裕

    エクサスケールのHPC環境を実現するに当たり、故障に対処する機能が必須となっている。Fault Toleranceは、システム側で故障に対応するため、故障の局所化が緩く、故障復旧に余計なコストが必要になり、エクサスケール環境の高故障率に耐えられないと考えられている。このため、必要最低限のコストで故障復旧を可能とするために、アプリケーションプログラマが故障対応のコードを記述するFault Resil …

    情報処理学会研究報告 2010年度(6), 1-7, 2011-04

    Cited by (1)

  • POP (Point-of-Presence) Linkage between Computer Centers as an E-Science Infrastructure  [in Japanese]

    TAKIZAWA SHIN'ICHIRO , MATSUOKA SATOSHI , SATO HITOSHI , HIGASHIDA MANABU , TOMOISHI MASAHIKO , JITSUMOTO HIDEYUKI

    ネットワーク分散した種々のリソースを統合して,科学技術の新発見・融合研究領域の開拓を促進する研究手法であるe-サイエンスが注目されている.e-サイエンス実現基盤として,我々は RENKEI-PoP と名付けた Point-of-Presence にて拠点間を接続するネットワーク環境を提案する.RENKEI-PoP は e-サイエンスリソースを提供する拠点に設置され,拠点内リソースとは強く結合し,R …

    情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 126, e1-e8, 2010-08-03

    References (12)

  • The Efficient Checkpoint based on Erasure Coding with Incremental Method  [in Japanese]

    JITSUMOTO HIDEYUKI , NAKAMURA SYUNSUKE , ENDO TOSHIO , MATSUOKA SATOSHI

    チェックポイント/リスタート手法は多くの大規模 HPC システムで利用されている耐故障機能である。しかし、近年の大規模 HPC システムのメモリサイズの急速な増大に比べ、並列ファイルシステムの I/O 帯域の増大は相対的に低いため、チェックポイント時間が増加してしまう問題がある。本研究では、チェックポイントのオーバヘッドを低く抑えつつ多重故障に対応することを目的とし、Erasure Coding …

    情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 122, I1-I6, 2009-10-09

    References (10)

  • Linpack Tuning on a Heterogeneous Supercomputer with Four Types of Processors  [in Japanese]

    ENDO TOSHIO , NUKADA AKIRA , MATSUOKA SATOSHI , MARUYAMA NAOYA , JITSUMOTO HIDEYUKI

    汎用プロセッサ二種とSIMD型アクセラレータ二種を備えたヘテロ型スパコンであるTSUBAMEにおけるLinpackベンチマークの実行について報告する.アクセラレータ型アーキテクチャは電力・設置面積を抑えつつ計算機システムの性能向上のために重要であるが,大規模並列計算を行った報告は筆者らの報告を除き依然少ない.TSUBAMEの約10000のOpteronコア,約500のXeonコア,約640基のCl …

    IPSJ SIG Notes 2009(14), 13-18, 2009-02-19

  • Linpack Tuning on a Heterogeneous Supercomputer with Four Types of Processors  [in Japanese]

    ENDO TOSHIO , NUKADA AKIRA , MATSUOKA SATOSHI , MARUYAMA NAOYA , JITSUMOTO HIDEYUKI

    汎用プロセッサ二種とSIMD型アクセラレータ二種を備えたヘテロ型スパコンであるTSUBAMEにおけるLinpackベンチマークの実行について報告する.アクセラレータ型アーキテクチャは電力・設置面積を抑えつつ計算機システムの性能向上のために重要であるが,大規模並列計算を行った報告は筆者らの報告を除き依然少ない.TSUBAMEの約10000のOpteronコア,約500のXeonコア,約640基のCl …

    IPSJ SIG Notes 182, 13-18, 2009-02-19

    References (10)

  • 情報爆発に対応する耐故障性MPIフレームワークの提案  [in Japanese]

    實本 英之 , 遠藤 敏夫 , 松岡 聡

    全国大会講演論文集 第70回(「情報爆発」時代に向けた新しいIT技術基盤), 133-134, 2008-03-13

    IPSJ  References (4)

  • ABARIS : An Adaptable Fault Detection/Recovery Component Framework for MPIs  [in Japanese]

    JITSUMOTO HIDEYUKI , ENDO TOSHIO , MATSUOKA SATOSHI

    大規模クラスタやグリッド等では,故障が発生しやすく長時間にわたるMPIアプリケーション実行のためには耐故障性が不可欠である.故障発生時の復旧方法は実行環境やアプリケーションによって変わるが,既存の耐故障性MPIは復旧方法の変更にほとんど非対応であり,対応可能でも,故障に応じた復旧方法をアプリケーションコード中に記述する必要がありユーザ負荷が高い.ABARISは実行環境やアプリケーションに合わせた復 …

    IPSJ SIG Notes 172, 163-168, 2007-03-01

    References (9)

  • 1 / 2
Page Top