マルチコアプロセッサ上での粗粒度タスク並列処理におけるデータ転送オーバラップ

  • 宮本 孝道
    早稲田大学理工学部コンピュータ・ネットワーク工学科
  • 中川 正洋
    早稲田大学理工学部コンピュータ・ネットワーク工学科
  • 浅野 尚一郎
    早稲田大学理工学部コンピュータ・ネットワーク工学科
  • 内藤 陽介
    早稲田大学理工学部コンピュータ・ネットワーク工学科
  • 仁藤 拓実
    早稲田大学理工学部コンピュータ・ネットワーク工学科
  • 中野 啓史
    早稲田大学理工学部コンピュータ・ネットワーク工学科
  • 木村 啓二
    早稲田大学理工学部コンピュータ・ネットワーク工学科
  • 笠原 博徳
    早稲田大学理工学部コンピュータ・ネットワーク工学科

書誌事項

タイトル別名
  • Data Transfer Overlap of Coarse Grain Task Parallel Processing on a Multicore Processor

この論文をさがす

抄録

半導体集積度向上に伴う消費電力の増大,プロセッサ実質速度向上の鈍化,ハードウェア,ソフトウェア開発期間の増大といった問題を解決すべく,一つのチップ上に複数のプロセッサコアを集積するマルチコアプロセッサが次世代プロセッサアーキテクチャとして注目を集めている.このマルチコアプロセッサにおいても,プロセッサとメモリ動作速度のギャップに伴うメモリウォールは深刻な問題であり,プロセッサに近接したキャッシュやローカルメモリ等の高速メモリの有効利用が実効性能向上のために重要なポイントであり,それに伴い発生するデータ転送によるオーバヘッドを減少させなければならない.このような事項を考慮して筆者等は自動マルチグレイン並列化コンパイラとの協調動作により実効性能が高く価格性能比の良いコンピュータシステムの実現を目指すOSCARマルチコアプロセッサを提案している.このOSCARマルチコアプロセッサは,全てのプロセッサコアがアクセスできる集中共有メモリ(CSM)の他に,プロセッサコアのプライベートデータを格納するローカルデータメモリ(LDM)とプロセッサコア間の同期やデータ転送に使用する2ポートメモリ構成の分散共有メモリ(DSM),そしてデータ転送オーバヘッドの隠蔽を目指し,プロセッサコアと非同期に動作可能なデータ転送ユニット(DTU)を持つ.本稿ではOSCARコンパイラを用いた粗粒度タスク並列処理において,DTUを利用したデータ転送オーバラップを考慮したタスクスケジューリングアルゴリズムとデータ転送スケジューリング手法によるデータ転送オーバラップ手法について述べる.提案手法をOSCARコンパイラに組み込み,JPEG2000エンコーディングプログラムに適用して評価を行った結果,4PEではほとんど全てデータをローカルメモリに割り当てた1PEでの処理と比べ2.86倍の速度向上率が得られた.

収録刊行物

被引用文献 (2)*注記

もっと見る

参考文献 (16)*注記

もっと見る

詳細情報 詳細情報について

  • CRID
    1570854176957979520
  • NII論文ID
    110004710260
  • NII書誌ID
    AN10096105
  • ISSN
    09196072
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ