西川 由理 NISHIKAWA Yuri

Articles:  1-20 of 62

  • 1 / 4
  • An implementation and evaluation of virtualization environments for PC cluster with accelerators  [in Japanese]

    Yoshimi Masato , Shitara Akihiro , Kamata Toshiaki , Yamada Masahiro , Nishikawa Yuri , Miki Mitsunori , Hiroyasu Tomoyuki , Amano Hideharu

    Cell/B.E.やGPUのようなアクセラレータを持つPCクラスタが,低消費エネルギーのままで高性能な計算機システムとして知られるようになった.これらのシステムを使う際に生じる深刻な問題のひとつに,並列プログラミングにおける実装の困難が挙げられる.本論文ではその実装コストを低減するために,アクセラレータを持つ計算ノード間のデータ通信を隠蔽する仮想化環境を提案する.この仮想化環境を使用するプログラマ …

    The Science and engineering review of Doshisha University 52(2), 156-162, 2011-07

    IR  DOI 

  • Performance Evaluation of High Performance Linpack on a Cell/B. E. Cluster with Heterogeneous Interconnect  [in Japanese]

    NISHIDA Ryota , NAKAHAMA Tetsuya , KAMATA Toshiaki , NISHIKAWA Yuri , AMANO Hideharu

    近年の並列化したスーパーコンピュータでは,プロセッサやインターコネクトが混合した環境が主流となりつつある.しかし,そのような並列コンピュータでは,インターコネクトがシステム全体のボトルネックとなる場合がある.System Area Network(SAN)や10Gigabit Ethernet(10GbE)などの高コストなインターコネクトを使用すればネットワークのボトルネックは緩和される.しかし, …

    IEICE technical report 110(473), 267-272, 2011-03-11

    References (9)

  • Performance Evaluation of High Performance Linpack on a Cell/B. E. Cluster with Heterogeneous Interconnect  [in Japanese]

    NISHIDA Ryota , NAKAHAMA Tetsuya , KAMATA Toshiaki , NISHIKAWA Yuri , AMANO Hideharu

    近年の並列化したスーパーコンピュータでは,プロセッサやインターコネクトが混合した環境が主流となりつつある.しかし,そのような並列コンピュータでは,インターコネクトがシステム全体のボトルネックとなる場合がある.System Area Network(SAN)や10Gigabit Ethernet(10GbE)などの高コストなインターコネクトを使用すればネットワークのボトルネックは緩和される.しかし, …

    IEICE technical report 110(474), 267-272, 2011-03-11

    References (9)

  • The implementation of development-support middleware on multiple-node environment of OpenCL Accelerator  [in Japanese]

    設樂 明宏 , 鎌田 俊昭 , 山田 昌弘 [他] , 西川 由理 , 吉見 真聡 , 天野 英晴

    GPU 等のアクセラレータを搭載したクラスタにおける並列プログラミングは,一般に CUDA や OpenCL 等のノード内における並列ライブラリと,MPI 等のノード間通信のライブラリを組み合わせることにより行われる.よって,2 種類の並列プログラミングの知識·技術の習得が不可欠であり,また,開発の過程において,OpenCL アプリケーションのノード間通信ライブラリ使用に対するコードの変換も必要で …

    情報処理学会研究報告 2010年度(5), 1-8, 2011-02

    Cited by (3)

  • Implementation and evaluation of program development middleware for Cell Broadband Engine clusters  [in Japanese]

    KAMATA Toshiaki , SHITARA Akihiro , NISHIKAWA Yuri , YOSHIMI Masato , AMANO Hideharu

    一般的にクラスタの計算資源を利用するためには,mpichやOpenMPIなどのライブラリを利用したプログラミングを行う必要がある.その場合,各プロセッサのノード間通信の制御に加え,Cell/B.E.内の制御を行う必要があり,2重の制御プログラムを記述する必要がある.上記の負担を軽減するため,本研究報告では、Cell Broadband Engine(Cell/B.E.)を含むクラスタにおいて,ネッ …

    IEICE technical report 110(360), 7-12, 2011-01-10

    References (7)

  • Implementation and evaluation of program development middleware for Cell Broadband Engine clusters  [in Japanese]

    KAMATA Toshiaki , SHITARA Akihiro , NISHIKAWA Yuri , YOSHIMI Masato , AMANO Hideharu

    一般的にクラスタの計算資源を利用するためには,mpichやOpenMPIなどのライブラリを利用したプログラミングを行う必要がある.その場合,各プロセッサのノード間通信の制御に加え,Cell/B.E.内の制御を行う必要があり,2重の制御プログラムを記述する必要がある.上記の負担を軽減するため,本研究報告では、Cell Broadband Engine(Cell/B.E.)を含むクラスタにおいて,ネッ …

    IEICE technical report 110(361), 7-12, 2011-01-10

    References (7)

  • Implementation and evaluation of program development middleware for Cell Broadband Engine clusters  [in Japanese]

    KAMATA Toshiaki , SHITARA Akihiro , NISHIKAWA Yuri , YOSHIMI Masato , AMANO Hideharu

    一般的にクラスタの計算資源を利用するためには,mpichやOpenMPIなどのライブラリを利用したプログラミングを行う必要がある.その場合,各プロセッサのノード間通信の制御に加え,Cell/B.E.内の制御を行う必要があり,2重の制御プログラムを記述する必要がある.上記の負担を軽減するため,本研究報告では、Cell Broadband Engine(Cell/B.E.)を含むクラスタにおいて,ネッ …

    IEICE technical report 110(362), 7-12, 2011-01-10

    References (7) Cited by (1)

  • Performance Evaluation of One-dimensional FPGA-cluster CUBE for Stream Applications  [in Japanese]

    吉見 真聡 , 西川 由理 , 天野 英晴 [他] , 三木 光範 , 廣安 知之 , オスカー メンサー

    本論文では,512個のFPGAから構成される1次元接続型FPGAアレイCUBEの性能評価を目的に,代表的なストリームアルゴリズムである文字列編集距離の並列アルゴリズムを実行するハードウェアを実装し,評価した結果について述べる.評価では,CUBEにおけるロジック資源量に加え,スループットおよび電力性能をマイクロプロセッサのマルチスレッド実行,高性能計算分野での普及が期待されているGPU(NVIDIA …

    情報処理学会論文誌コンピューティングシステム(ACS) 3(3), 209-220, 2010-09-17

    IPSJ 

  • A Non-minimal Fully Adaptive Routing Using Single-flit Single-cycle Routers for NoCs  [in Japanese]

    西川 由理 , 鯉渕 道紘 , 松谷 宏紀 [他] , 天野 英晴

    チップマルチプロセッサ(CMP)のチップ内ネットワークではコヒーレンス転送などで生じる1,flitにおさまる小さいメッセージを扱う場合が多い.そこで,本稿では,1-flitパケット転送に適した非最短完全適応型ルーティング機構であるSemi-deflectionルーティングを提案する.Semi-deflectionルーティングは一部のルータ間のパケット転送をノンブロッキングで行うことで仮想チャネルを …

    情報処理学会論文誌コンピューティングシステム(ACS) 3(3), 88-99, 2010-09-17

    IPSJ 

  • A Proposal of Offload Structure for Cell Broadband Engine  [in Japanese]

    KAMATA TOSHIAKI , NISHIKAWA YURI , YOSHIMI MASATO , AMANO HIDEHARU

    本研究報告では,ヘテロジニアスなマルチコアプロセッサを用いたクラスタにおいて,その計算資源を効果的に利用するためのオフロード機構の提案を行う.Cell Broadband Engine (Cell/B.E.) に代表されるアクセラレータは近年ますます注目を集めつつあるが,プログラミングの複雑さなどから,計算資源を利用するためには高度な技術が求められる.ユーザのプログラマビリティの向上を目指すため, …

    情報処理学会研究報告. 計算機アーキテクチャ研究会報告 190, U1-U6, 2010-08-03

    References (7)

  • The proposal of inter-node communication in heterogeneous interconnect cluster using InfiniBand and Ethernet  [in Japanese]

    NAKAHAMA TETSUYA , NISHIKAWA YURI , YOSHIMI MASATO , AMANO HIDEHARU

    近年の高性能な PC クラスタでは、GPU と汎用 CPU などの異種混合型が主流となりつつある。本研究報告では、まず、現在我々が構築中の異種混合型の Cell PC クラスタ構想を述べる。本 PC クラスタは、312 個の Cell/B.E. を搭載し、そのインターコネクトには Ethernet, InfiniBand, Fibre Channel の 3 つが採用されている。次に、Cell/B …

    情報処理学会研究報告. 計算機アーキテクチャ研究会報告 190, P1-P7, 2010-08-03

    References (11)

  • The implementation of cache mechanism on the thread virtualization environment for cell cluster  [in Japanese]

    YAMADA MASAHIRO , NISHIKAWA YURI , YOSHIMI MASATO , AMANO HIDEHARU

    クラスタにおける並列分散処理を行うプログラムは, 一般に MPI 等のノード間通信ライブラリを用いた並列プログラミングにより実装される.しかし, マルチコアプロセッサを用いたクラスタを利用するには,ノード間に加えノード内でのマルチスレッドプログラミングが必要であり,性質の異なる並列プログラミングの知識·技術の習得が求められる.そのため,我々はネットワーク上に接続された複数ノードの演算コアを,仮想的 …

    情報処理学会研究報告. 計算機アーキテクチャ研究会報告 190, N1-N8, 2010-08-03

    References (9)

  • Implementation and Evaluation of Photon Mapping on Cell Broadband Engine  [in Japanese]

    OHNISHI Nobuhiro , KAMATA Toshiaki , NISHIKAWA Yuri , SHITARA Akihiro , YOSHIMI Masato , FUJISHIRO Issei , AMANO Hideharu

    本研究報告では間接照明の影響を考慮し,集光模様の表現力に優れるレンダリング手法であるphoton mappingのCell Broadband Engine (Cell/B.E.)上での実装方法と,その性能評価について述べる.photon mappingを実装した結果,今後の課題は多く残るが,Cell/B.E.の演算用コアであるSPEを8個使用した時の性能がSPEを1個使用した時の約6倍になり,高 …

    IEICE technical report 110(167), 19-24, 2010-07-28

    References (5) Cited by (1)

  • A datapath classification method for efficient arithmetic pipeline combining on FPGAs  [in Japanese]

    OGAWA Yui , OOYA Tomonori , OSANA Yasunori , YOSHIMI Masato , NISHIKAWA Yuri , FUNAHASHI Akira , HIROI Noriko , AMANO Hideharu , SHIBATA Yuichiro , OGURI Kiyoshi

    浮動小数点を用いたアプリケーションの分野では,FPGAベースの大規模なアクセラレータシステムが広く開発されている.FPGA上で利用可能な資源には限りがあるため,このようなシステムでは資源削減手法が重要な役割を担っている.本稿では,データパスの結合による影響を明らかにするために,データパスの類似性を基にそれらをクラスタ(グループ)に分類する手法を提案する.k-means法をベースとしたアルゴリズムに …

    IEICE technical report 110(32), 43-48, 2010-05-06

    References (15)

  • Proposal of Thread Virtualization Environment on Cell Broadband Engine  [in Japanese]

    YAMADA Masahiro , NISHIKAWA Yuri , YOSHIMI Masato , AMANO Hideharu

    本研究報告では,マルチコアプロセッサを用いたクラスタの並列分散処理環境であるスレッド仮想化環境を設計・提案し,その実装と評価について述べる.一般にクラスタにおける並列分散処理を行うには,MPI等のノード間通信ライブラリを用いた並列プログラミングを行う.しかし,マルチコアプロセッサを用いたクラスタを利用するには,ノード間に加え,ノード内でのマルチスレッドプログラミングが必要であり,性質の異なる並列プ …

    IEICE technical report 110(2), 27-32, 2010-04-06

    References (8) Cited by (5)

  • Proposal of Thread Virtualization Environment on Cell Broadband Engine  [in Japanese]

    YAMADA Masahiro , NISHIKAWA Yuri , YOSHIMI Masato , AMANO Hideharu

    本研究報告では,マルチコアプロセッサを用いたクラスタの並列分散処理環境であるスレッド仮想化環境を設計・提案し,その実装と評価について述べる.一般にクラスタにおける並列分散処理を行うには,MPI等のノード間通信ライブラリを用いた並列プログラミングを行う.しかし,マルチコアプロセッサを用いたクラスタを利用するには,ノード間に加え,ノード内でのマルチスレッドプログラミングが必要であり,性質の異なる並列プ …

    IEICE technical report 110(3), 27-32, 2010-04-06

    References (8)

  • A Non-minimal Fully Adaptive Routing Using a Single-Flit Packet Structure  [in Japanese]

    NISHIKAWA Yuri , KOIBUCHI Michihiro , MATSUTANI Hiroki , AMANO Hideharu

    本稿では、チップ内ネットワーク向けに仮想チャネルを使わない非最短型完全適応ルーティングを提案する.パケット間のデッドロックフリーを実現するために,(1)一部のルータ間のパケット転送をノンブロッキングで行い,かつ,(2)すべてのメッセージを1-flitパケットに分割し,独立に転送する.評価結果より,提案ルーティングは2次元Meshトポロジにおいて,典型的な適応型ルーティングであるNorth-last …

    IEICE technical report 109(393), 53-58, 2010-01-19

    References (7)

  • A Non-minimal Fully Adaptive Routing Using a Single-Flit Packet Structure  [in Japanese]

    NISHIKAWA Yuri , KOIBUCHI Michihiro , MATSUTANI Hiroki , AMANO Hideharu

    本稿では、チップ内ネットワーク向けに仮想チャネルを使わない非最短型完全適応ルーティングを提案する.パケット間のデッドロックフリーを実現するために,(1)一部のルータ間のパケット転送をノンブロッキングで行い,かつ,(2)すべてのメッセージを1-fitパケットに分割し,独立に転送する.評価結果より,提案ルーティングは2次元Meshトポロジにおいて,典型的な適応型ルーティングであるNorth-lastル …

    IEICE technical report 109(394), 53-58, 2010-01-19

    References (7)

  • A Non-minimal Fully Adaptive Routing Using a Single-Flit Packet Structure  [in Japanese]

    NISHIKAWA Yuri , KOIBUCHI Michihiro , MATSUTANI Hiroki , AMANO Hideharu

    パケット間のデッドロックフリーを実現するために,(1)一部のルータ間のパケット転送をノンブロッキングで行い,かつ,(2)すべてのメッセージを1-flitパケットに分割し,独立に転送する.評価結果より,提案ルーティングは2次元Meshトポロジにおいて,典型的な適応型ルーティングであるNorth-lastルーティングアルゴリズムを用いた1-flitパケット転送と比べ,最大2.48倍の性能向上を達成した …

    IEICE technical report 109(395), 53-58, 2010-01-19

    References (7)

  • The implementation of development-support middleware on multiple-node environment of OpenCL Accelerator  [in Japanese]

    設楽 , 鎌田 俊昭 , 山田 昌弘 , 西川 由理 , 吉見 真聡 , 天野 英晴

    GPU 等のアクセラレータを搭載したクラスタにおける並列プログラミングは,一般に CUDA や OpenCL 等のノード内における並列ライブラリと,MPI 等のノード間通信のライブラリを組み合わせることにより行われる.よって,2 種類の並列プログラミングの知識·技術の習得が不可欠であり,また,開発の過程において,OpenCL アプリケーションのノード間通信ライブラリ使用に対するコードの変換も必要で …

    情報処理学会研究報告. 計算機アーキテクチャ研究会報告 2010-ARC-192(22), 1-8, 2010

    Cited by (1)

  • 1 / 4
Page Top