動的推定によるプリフェッチ量最適化

書誌事項

タイトル別名
  • ドウテキ スイテイ ニ ヨル プリフェッチリョウ サイテキ カ
  • Prefetch Throttling Technique Based on Dynamic Assumption

この論文をさがす

抄録

プロセッサアーキテクチャにおける重要な課題として,増加を続けるメモリレイテンシの克服があげられる.データを投機的に先読みするプリフェッチ技術はレイテンシ隠蔽に効果的であり,汎用プロセッサへの採用が進んでいる.しかしプリフェッチには,プログラムやキャッシュ容量次第で最適プリフェッチ量が変化し,性能を大きく増減させるという問題がある.最適なプリフェッチ量を実現するために,予測精度などに着目してフィードバックをかける手法が提案されているが,プログラムとキャッシュ容量のバランスは多様であり,まだ十分な制御とはなっていない.本論文では,理想的なプリフェッチ量に関する考察をふまえ,キャッシュの内部データ対流とデータ取り込み速度のバランスに着目したプリフェッチスロットリング,CCCPO(Cache-Convection-Control based Prefetch Optimization)を提案する.一般的なスロットリング手法と異なり,提案手法はプリフェッチ履歴を用いず,数本のカウンタで実装可能である.シーケンシャルプリフェッチに適用した評価では,多様なプログラムに対して安定したプリフェッチを実現した.予測精度に着目した従来スロットリング手法に対し,提案手法は最大で13%,調和平均でも1.3%の性能向上を示した.

One of the significant issues of processor architecture is to overcome increasing memory latency. Prefetches are commonly used in general propose processors because of their effectiveness for latency hiding. However, prefetches have a drawback that they can both increase and decrease performance unless their aggressiveness is set properly. Although several techniques which throttle prefetch-aggressiveness with some metrics like accuracy are proposed, their controls are not sufficient due to the variation of the balance between program working sets and cache capacities. In this paper, we discuss the ideal prefetch throttling, and based on this, propose CCCPO (Cache-Convection-Control based Prefetch Optimization) throttling, which controls the balance between “line convection” and input speed of the cache. Our technique is able to be implemented with few counters. Introduced into sequential prefetcher, our technique achieved stable prefetch for various programs. It showed max 13% performance improvement against the existing prefeth throttling which focused on prefech accuracy, and 1.3% in geometric mean.

収録刊行物

関連プロジェクト

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ