組み込み向けモデルベース開発アプリケーションのプロファイル情報を用いたマルチコア用マルチグレイン並列処理

書誌事項

タイトル別名
  • Multigrain Parallelization Using Profile Information of Embedded Applications Generated by Model-based Development Tools on Multicore Processors

この論文をさがす

抄録

現在の組み込みシステム開発ではMATLAB/Simulinikに代表されるモデルベース開発ツールがよく使用されるようになっている.また,開発されたモデルの複雑化とともに,このようなツールで開発されるアプリケーションのマルチコア上での高性能化,低消費電力化の要求が高まってきている.この要求に対して,モデル中のブロック間並列性を利用した並列化の提案はされているが,ブロック間だけでなく,ブロック内の並列性を利用したアプリケーション全体の並列性を有効利用できる方式は提案されていない.そこで,本論文では逐次Cプログラムから並列化Cプログラムを生成可能なOSCAR自動並列化コンパイラを用いて,MATLAB/SimulinkからEmbedded Coderを使って自動生成されたCプログラムに対して,モデル上に現れるブロック間並列性および,ブロック内のベクトル演算やユーザカスタマイズのコードからループ並列性を抽出し,マルチグレイン並列化を行う.また,マルチグレイン並列化の際に,Simulink上で得られたプロファイル情報を使ったタスクスケジューリングを行うことによりスケジューリングの精度向上を行う.提案手法によりXeon X5670上の6コアを使い,逐次実行時間と比較して道路追従アプリケーションでは4.21倍,血管抽出アプリケーションでは5.80倍,異常検出アプリケーションでは4.10倍の速度向上率が得られた.また,道路追従アプリケーションに関しては逐次の最悪実行時の実行時間と比較して,4.81倍の速度向上率が得られた.

Model-based development tools such as the MATLAB/Simulink have become popular for development of embedded systems recently. These applications require high performance and low power processing on multicores. Therefore, several researchers have proposed parallel processing of these applications utilizing parallelism among blocks in these models. However, no one proposes a method to extract all parallelism from not only among blocks but also in a block in these models. This paper proposes multigrain parallelization of C program generated by Embedded Coder from MATLAB/Simulink utilizing both coarse grain task parallelism among blocks and loop parallelism in a block including a vector operation or user's customized code using the OSCAR automatic parallelizing compiler. The compiler generates a parallelized C program from a sequential C program. The proposed method utilizes profiling information on Simulink to improve scheduling results into a multicore. It attains 4.21 times speedup for road tracking application, 5.80 times speedup for vessel detecting application and 4.10 times speedup for abnormality detecting application using six cores of Xeon X5670 compared with case of an ordinary sequential execution. Also, it attains 4.81 times speed up for road tracking application in worse case execution.

収録刊行物

詳細情報 詳細情報について

  • CRID
    1050564287860451840
  • NII論文ID
    170000130882
  • NII書誌ID
    AN00116647
  • ISSN
    18827764
  • Web Site
    http://id.nii.ac.jp/1001/00148180/
  • 本文言語コード
    ja
  • 資料種別
    journal article
  • データソース種別
    • IRDB
    • CiNii Articles

問題の指摘

ページトップへ