検索結果を絞り込む

本文・本体へのリンク

検索結果 743 件

  • GPU-Accelerated 3D Normal Distributions Transform

    Nguyen Anh, Cano Abraham Monrroy, Edahiro Masato, Kato Shinpei Journal of Robotics and Mechatronics 35 (2), 445-459, 2023-04-20

    <p>The three-dimensional (3D) normal distributions transform (NDT) is a popular scan registration method for 3D point cloud datasets. It has been widely used in sensor-based localization and mapping …

    DOI Web Site Web Site 参考文献16件

  • 粗粒度分割を用いた並列マージ処理の高速化

    千葉 理揮, 中西 正樹 電子情報通信学会論文誌D 情報・システム J106-D (2), 173-183, 2023-02-01

    本論文では,CUDAデバイス上で行われる,2列のソート済みデータ列を対象とするマージ処理の高速化を行った.本論文で提案する手法は,マージ処理を分割する際の粒度を粗くすることで,分割に要する処理時間を低減し,グローバルメモリのバンド幅を最大限活用できる.これにより,大規模な入力に対しては限界に近い性能をもつことを示せた.また,提案手法は実験に用いた全ての入力に対して既存のマージアルゴリズムよりも高…

    DOI

  • GPUを用いたブロックチェーンにおける取引検証の性能評価

    森島 信 電子情報通信学会論文誌D 情報・システム J105-D (11), 657-668, 2022-11-01

    ブロックチェーンは,多数のノードが参加するP2Pネットワーク上に構成される分散台帳であり,信頼できる第三者機関を介さない取引を可能にする技術である.第三者機関を介さないことによるコスト削減効果などから,個人間,国際間取引を始めとして,様々な用途での利用が期待されている.しかし,ネットワークに参加する全てのノードが取引の検証を行うため,取引生成性能が低いという問題がある.この問題に対して,複数のチ…

    DOI

  • 低電力化のためのGPU,FPGA自動オフロードの評価

    山登 庸次 電子情報通信学会論文誌D 情報・システム J105-D (4), 283-286, 2022-04-01

    私は,通常コードを,環境に応じて自動変換し,高性能,低電力で運用可能とする環境適応ソフトウェアを提案し,GPU,FPGAへの自動オフロードでの性能向上を検証してきた.本論文では,自動オフロード時の電力使用量を確認し,環境適応による低電力化を検証する.

    DOI

  • GPGPU Implementation of Variational Bayesian Gaussian Mixture Models

    NISHIMOTO Hiroki, ZHANG Renyuan, NAKASHIMA Yasuhiko IEICE Transactions on Information and Systems E105.D (3), 611-622, 2022-03-01

    ...The CPU-GPGPU co-operation scheme, execution re-order, and memory access optimization are proposed for optimizing the GPGPU utilization and maximizing the clustering speed....

    DOI Web Site 参考文献9件

  • Acceleration of the FaSTAR Solver on GPU with OpenACC

    ゼネール, ポール, 橋本, 敦, ZEHNER, Paul, HASHIMOTO, Atsushi 宇宙航空研究開発機構特別資料: 第53回流体力学講演会/第39回航空宇宙数値シミュレーション技術シンポジウム論文集 = JAXA Special Publication: Proceedings of the 53rd Fluid Dynamics Conference / the 39th Aerospace Numerical Simulation Symposium JAXA-SP-21-008 263-271, 2022-02-14

    第53回流体力学講演会/第39回航空宇宙数値シミュレーション技術シンポジウム (2021年6月30日-7月2日. 日本航空宇宙学会 : 宇宙航空研究開発機構(JAXA)オンライン会議)

    機関リポジトリ

  • Instruction Prefetch for Improving GPGPU Performance

    CAO Jianli, CHEN Zhikui, WANG Yuxin, GUO He, WANG Pengcheng IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences E104.A (5), 773-785, 2021-05-01

    ...<p>Like many processors, GPGPU suffers from memory wall....

    DOI Web Site 参考文献19件

  • 近傍粒子リストの改良と空間ブロッキングによる DEM の高速化とメモリ使用量の削減

    亀谷 洋大, 梅景 俊彦 日本計算工学会論文集 2021 (0), 20210003-20210003, 2021-03-03

    <p>多くの計算量を必要とするDEMシミュレーションのGPU実装における高速化とメモリ使用量の削減を行なった.既存研究で提案された近傍粒子リストのデータ構造を見直し性能の向上とメモリ容量の削減を同時に実現した.またステンシル計算の高速化で用いられてきた空間ブロッキングによる高速化手法を適用し接触粒子の参照におけるメモリアクセスを改善した.本研究で提案した手法を全て用いた場合,計算速度は平均して1…

    DOI

  • Incremental auto-tuningを用いたOpenCLのhybrid並列化

    若谷 彰良, Akiyoshi WAKATANI 甲南大学紀要. 知能情報学編 = Memoirs of Konan University. Intelligence & Informatics Series 13 (2), 103-110, 2021-02-10

    ...最近のプロセッサにはGPUと複数のプロセシングコアの両方を内蔵するものがあり,GPUのGPGPUに基づく並列処理とCPUにおけるマルチスレディングに基づく並列処理を同時に行うhybrid並列が利用可能になっているが,アプリケーションによってCPUとGPUの性能の比は異なり,最適な負荷分散をあらかじめ決定することは難しい.著者らは以前に,最適な負荷分散を実行時に決定する,on-the-flyな自動チューニング...

    DOI 機関リポジトリ

  • マルチカラー体積型ホログラムのマルチGPUを用いた高速計算

    齋藤 正輝, 廣橋 美葵, 山口 健, 吉川 浩 映像情報メディア学会技術報告 41.12 (0), 161-164, 2021

    体積型ホログラムは波長選択性があり,白色光による特定の波長再生が可能なことが知られている.本報告では,緑と赤のレーザによる時分割多重露光を行い,マルチカラー化を行った.また,CGH計算において,一定の領域ごとに分割したホログラムを複数のGPUで並列して計算させることにより,CPUのみで計算した場合と比較して最大131倍,高速化することができた.

    DOI

  • A Rabin-Karp Implementation for Handling Multiple Pattern-Matching on the GPU

    NUNES Lucas Saad Nogueira, BORDIM Jacir Luiz, ITO Yasuaki, NAKANO Koji IEICE Transactions on Information and Systems E103.D (12), 2412-2420, 2020-12-01

    <p>The volume of digital information is growing at an extremely fast pace which, in turn, exacerbates the need of efficient mechanisms to find the presence of a pattern in an input text or a set of …

    DOI Web Site 参考文献18件

  • 地中熱交換器周囲温度場計算における畳み込みのGPGPUを用いた高速化

    小司 優陸, 葛 隆生, 阪田 義隆, 長野 克則 日本冷凍空調学会論文集 37 (3), 313-, 2020-09-30

    <p> 地中熱利用システムはその高効率性の一方で導入コストが高額となるため,ライフサイクルコストの評価によるシステムの最適設計が必要とされる.このライフサイクルコストの評価を行うため地中熱利用システムの設計段階においては長期間のシステムシミュレーションが不可欠であり,高速なシミュレーション手法の開発が課題となっている.この課題に関して,地中熱利用システムにおいて肝要である地中熱交換器周囲温度場の…

    DOI Web Site

  • オンサイトでの高精度数値シミュレーション実施のためのGPU向き疎行列圧縮スキーム

    河村, 知記, 米田, 一徳, 岩村, 尚, 渡邉, 正宏, 井口, 寧 情報処理学会論文誌数理モデル化と応用(TOM) 13 (2), 93-106, 2020-08-28

    ...近年,計算機の高性能化にともない数値シミュレーションをオンサイトでリアルタイムに実行し,様々な産業に応用することが期待されている.このようなシミュレーションは,GPGPUを利用することによって実用的な計算時間での実行が期待できるが,メモリ容量の制約が大きな問題点である.そこで本稿では数値シミュレーションの代表的手法であるFinite Element Method(FEM)で現れる疎行列のメモリ使用量削減手法...

    情報処理学会

  • Fast Euclidean Cluster Extraction Using GPUs

    Nguyen Anh, Cano Abraham Monrroy, Edahiro Masato, Kato Shinpei Journal of Robotics and Mechatronics 32 (3), 548-560, 2020-06-20

    <p>Clustering is the task of dividing an input dataset into groups of objects based on their similarity. This process is frequently required in many applications. However, it is computationally …

    DOI Web Site Web Site 参考文献9件

  • Lift中間言語における動的長配列の追加

    新美, 和生, 増原, 英彦 情報処理学会論文誌プログラミング(PRO) 13 (3), 1-12, 2020-06-17

    LIFT ILはGPGPUプログラムのための配列指向の中間言語である.LIFT コンパイラは高級言語プログラムをOpenCLプログラムに変換する際に,中間言語であるLIFT IL上でハードウェア依存の最適化を行う.一方,LIFT ILには動的に長さが決まる配列を表現できないという問題がある.なぜならばLIFT …

    情報処理学会

  • LD法によるエアロゾルの凝集過程のシミュレーション

    藤本 敏行 ホソカワ粉体工学振興財団年報 27 (0), 87-93, 2020-05-25

    <p>エアロゾル粒子のランダムなブラウン運動を疑似乱数を用いて表現するLangevin動力学(LD)法によって粒子の軌跡を直接計算し,エアロゾルの凝集速度定数の算出を試みた.球形の空間内での複数の粒子と単一の粒子の衝突時間間隔と濃度分布を求めるMTBC法を開発し,遷移領域における凝集速度定数を計算した.無限遠での粒子濃度の補正を行って得られた凝集速度定数は,Flux …

    DOI Web Site 参考文献10件

  • Accelerated FDPS: Algorithms to use accelerators with FDPS

    岩澤, 全規, Namekata, Daisuke, Nitadori, Keigo, 野村, 昴太郎, Wang, Long, Tsubouchi, Miyuki, Makino, Junichiro Publications of the Astronomical Society of Japan 72 (1), 13-13, 2020-02

    ...We describe algorithms implemented in FDPS (Framework for Developing Particle Simulators) to make efficient use of accelerator hardware such as GPGPUs (general-purpose computing on graphics processing...

    DOI HANDLE PDF 被引用文献5件 参考文献14件

  • TensorShader : 高次元ニューラルネットワーク深層学習フレームワーク

    吉村 拓馬 人工知能学会全国大会論文集 JSAI2020 (0), 1J5GS201-1J5GS201, 2020

    <p>近年, 複素数や四元数などの多元数を基とする高次元ニューラルネットワークの研究が進められている. 一方で, 高次元ニューラルネットワークをGPUで扱うことのできる深層学習フレームワークは未だに少なく, 実験の障壁となっている. そこで本研究では,複素数,四元数,3次元ベクトルを基とする深層学習フレームワークを開発した.このフレームワークでは, …

    DOI

  • セルオートマトン法による対話的な結晶成長表現手法の開発

    伊澤 賢人, 床井 浩平 画像電子学会研究会講演予稿 19.04 (0), 340-341, 2020

    本研究では水晶の結晶成長シミュレーションを対話的な速度で行う手法の開発を行った.水晶の結晶 構造から 3 次元格子点群を定義し,セルオートマトン法を用いて各セルが結晶化しているかどうかといった結晶状 態を並列に更新することで結晶成長の形状変化をシミュレーションする.そして各格子点の結晶状況をもとにマー チングキューブ法を用いて結晶を描画し対話的な速度での結晶成長表現を目指した.

    DOI

  • Hastega:Elixirプログラミングにおける線形回帰のSIMD命令による並列化

    久江, 雄喜, 山崎, 進 情報処理学会論文誌プログラミング(PRO) 12 (3), 9-9, 2019-07-17

    現在,AI・機械学習のソフトウェア開発で用いられるプログラミング言語は,Pythonがデファクトスタンダードである.しかし,Pythonの言語処理系そのものが並列化されていないため,IoTから送られてくる大量のデータをリアルタイムで処理するには,Pyhton単体では力不足である.この問題の解決策として,我々は並列プログラミング言語Elixirに注目している.我々はHastegaというElixir…

    情報処理学会

  • Development of a GPGPU-parallelized hybrid finite-discrete element method for modeling rock fracture

    Fukuda, Daisuke, Mohammadnejad, Mojtaba, Liu, Hongyuan, Dehkhoda, Sevda, Chan, Andrew, Cho, Sang-Ho, Min, Gyeong-Jo, Han, Haoyu, Kodama, Jun-ichi, Fujii, Yoshiaki International journal for numerical and analytical methods in geomechanics 43 (10), 1797-1824, 2019-07

    ...Because the contact detection algorithm in the sequential code is not suitable for GPGPU parallelization, a different contact detection algorithm is implemented in the GPGPU-parallelized hybrid FDEM....

    HANDLE

  • ARGA

    Daniel Peroni, Mohsen Imani, Hamid Nejatollahi, Nikil Dutt, Tajana Rosing Proceedings of the 56th Annual Design Automation Conference 2019 2019-06-02

    DOI Web Site 被引用文献1件

  • Development of a GPGPU‐parallelized hybrid finite‐discrete element method for modeling rock fracture

    Daisuke Fukuda, Mojtaba Mohammadnejad, Hongyuan Liu, Sevda Dehkhoda, Andrew Chan, Sang‐Ho Cho, Gyeong‐Jo Min, Haoyu Han, Jun‐ichi Kodama, Yoshiaki Fujii International Journal for Numerical and Analytical Methods in Geomechanics 43 (10), 1797-1824, 2019-05-02

    ...Because the contact detection algorithm in the sequential code is not suitable for GPGPU parallelization, a different contact detection algorithm is implemented in the GPGPU‐parallelized hybrid FDEM....

    DOI Web Site Web Site 被引用文献10件 参考文献52件

  • Accurate Tool Path Generation Method for Large-Scale Discrete Shapes

    Kitahara Hiromu, Kaneko Jun’ichi, Ajisaka Masahiro, Abe Takeyuki, Horio Kenichiro International Journal of Automation Technology 13 (2), 279-288, 2019-03-05

    <p>Three-axis ball end mills are used for the finishing of metal molds of complicated curved surfaces. Typically, a tool path of this shape machining is derived from the geometric calculations of a …

    DOI Web Site Web Site 被引用文献2件 参考文献20件

  • 肝臓手術サポートシステムにおけるDICOM深度画像と実肝臓モデルによる位置姿勢推定精度の評価

    矢野, 大貴, 森, 拓海, 小枝, 正直, 大西, 克彦, 登尾, 啓史 第81回全国大会講演論文集 2019 (1), 33-34, 2019-02-28

    ...肝臓手術は,多数の血管が張り巡らされており血管構造が複雑なため難しい.また体の複雑な機能を担っている為に全摘出が困難である.術前診断でのMRIやCTを用いて,血管位置を把握することができるが,術中に変化する位置姿勢を考慮して臓器の内部構造を詳細に把握することは不可能である.本研究では,肝臓の開腹手術を対象とした手術サポートシステムを関西医科大学と共同して開発中である.本稿では,GPGPUによる並列処理...

    情報処理学会

  • GPUを用いた行列-行列積の実装と性能評価

    榊田, 匠, 田中, 輝雄, 藤井, 昭宏 第81回全国大会講演論文集 2019 (1), 87-88, 2019-02-28

    ...GPUを汎用的な計算に使用するGPGPUが注目されている.この環境でソフトウェアの性能を向上させるには,多数のスレッドによる超並列やコアレスアクセスなどGPUのハードウェア特性を考慮する必要がある.本研究ではNVIDIAのGPU Tesla P100/V100を用いて,基本的な数値計算アルゴリズムの一つである行列-行列積を対象として,Streaming Multiprocessor使用率やShared...

    情報処理学会

  • GPGPU向け2値画像の連結成分抽出と同時穴埋め処理の高速化手法の提案と実装

    木綱, 啓人, 佐藤, 裕幸 第81回全国大会講演論文集 2019 (1), 81-82, 2019-02-28

    ...古典的な画像処理の一つであり,2値画像から連結した同一画素値を持つ画素分を抽出でき,物体やノイズ領域の抽出に使われる.穴埋め処理は光学画像による医療診断等における2値化時のノイズの除去に用いられる.この処理は背景成分の連結成分を抽出し,面積の小さな成分を前景化後,前景成分の連結成分を抽出することでノイズ除去済みの前景成分を抽出できる.本稿では前・背景を同時に抽出した連結成分を用いた穴埋め処理についてのGPGPU...

    情報処理学会

  • Hastega:Elixirプログラミングにおける超並列化を実現するためのGPGPU活用手法

    山崎, 進, 森, 正和, 上野, 嘉大, 高瀬, 英希 情報処理学会論文誌プログラミング(PRO) 12 (1), 15-15, 2019-01-30

    ElixirではFlowというMapReduceの並列ライブラリが普及している.Flowを用いると簡潔な表現でマルチコアCPUの並列性を活用できる.我々はFlowによるプログラム記述がGPGPUにも容易に適用できるという着想を得て,OpenCLによるプロトタイプを実装した.現行のGPUで採用されるSIMDでは,単純な構造で均質で大量にあるデータを同じような命令列で処理する場合に効果を発揮する.一…

    情報処理学会

  • GPGPUを用いた差分格子ボルツマン法による流体音数値解析

    田畑, 諒也, 小林, 泰三 情報処理学会論文誌プログラミング(PRO) 12 (1), 14-14, 2019-01-30

    本発表では,流体音数値解析の手法として差分格子ボルツマン法とそのGPGPU利用の可能性を議論する.輸送機械や楽器・音響機器の一部の問題では流体と音の相互作用を考慮する必要があり,圧縮性流体数値解析による流体音の直接計算が行われている.しかし,この方法では流体と音波を同時に解析するため,細かなメッシュとタイムステップが必要となり多大な計算コストを要する.GPUを用いた計算ではCPU-GPU間通信が…

    情報処理学会

  • 医用ナビゲーションのためのリアルタイム超音波画像処理

    小野木 真哉, 長尾 吉泰, 赤星 朋比古, 副島 雄二, 江藤 正俊, 橋爪 誠 生体医工学 Annual57 (Abstract), S3_1-S3_1, 2019

    ...比較してリアルタイム性に優れ装置が小型であることから診断だけでなくイメージガイド下治療・処置に広く使用されている.一方で,術中利用可能なプローブは2Dであり,三次元的な血管網をその場で把握するためには,走査を繰り返して三次元形状・構造を想像する必要がある.そのため,我々は術中にその場で3D超音波画像を構築し呈示する超音波ナビゲーション技術について研究に取り組んできた.本発表では,これまで開発してきたGPGPU...

    DOI

  • 自由エネルギー摂動法(FEP)を用いた阻害活性の高精度予測

    三沢 憲佑 ファルマシア 55 (5), 443-443, 2019

    ...熱力学的積分法などのアルケミカル的な手法が考案されてきた.これらの手法は,徐々にリガンドを変換しながらその中間状態を計算することで,構造的に類似したリガンド分子の結合自由エネルギー差を厳密に予測できる手法であるが,計算時間や精度の観点から,これまで産業界ではあまり活用が進んでいなかった.しかし近年,general-purpose computing on graphics processing units(GPGPU...

    DOI

  • 地中温度応答の畳み込み計算におけるGPGPUを用いた高速化

    小司 優陸, 葛 隆生, 阪田 義隆, 長野 克則 空気調和・衛生工学会大会 学術講演論文集 2019.2 (0), 97-100, 2019

    <p>地中熱利用システムでは,地中熱交換器最適設計のため高速に長期間のシミュレーションを行うことが必要とされる.このシミュレーションにおいて肝要な地中熱交換器周囲温度は,地中放熱量と地中温度応答関数の畳み込みによって計算される.本研究ではこの畳み込み計算について,Graphical Processing …

    DOI

  • GPU上のMapReduceを利用した大規模データ処理の最適化

    柳本, 晟熙, 欅, 惇志, 宮崎, 純 情報処理学会論文誌データベース(TOD) 11 (3), 23-34, 2018-10-17

    本研究では,GPU上で実装された並列分散処理フレームワークMapReduceによる大規模データ処理の最適化手法を提案する.一般にGPUのメモリサイズはメインメモリよりも小さく,大規模なデータを一度にすべてGPUのメモリに転送して処理を行うことは困難である.そこで本研究では,データを複数のチャンクに分割してGPU上で繰り返しMapReduce処理を行う際の最適な分割粒度をコストモデルを用いて明らか…

    情報処理学会

  • On-GPU Thread-Data Remapping for Branch Divergence Reduction

    Huanxin Lin, Cho-Li Wang, Hongyuan Liu ACM Transactions on Architecture and Code Optimization 15 (3), 1-24, 2018-09-30

    ...<jats:p>General Purpose GPU computing (GPGPU) plays an increasingly vital role in high performance computing and other areas like deep learning....

    DOI Web Site 被引用文献1件

  • 負荷分散比自動チューニング機能を備えたFPGA-CPUハイブリッド実行向け設計支援ツールの提案

    胡濱, 良樹, 窪田, 昌史, 谷川, 一哉, 弘中, 哲夫 情報処理学会論文誌プログラミング(PRO) 11 (3), 29-29, 2018-09-20

    高位合成ツールの進展により書き換え可能なハードウェアであるFPGAをアクセラレータとして用い,C言語やOpenCLで記述された処理を高速化する手法が実用的になってきている.その結果,演算処理をCPUとFPGAの双方に負荷分散し,処理の高速化を実現するハイブリッド実行が利用可能である.しかし,ハイブリッド実行を行ううえでCPUとFPGAとの負荷分散比を手動で的確に決定するのはCPUとGPGPUにお…

    情報処理学会

  • 肝臓手術サポートシステムにおけるGPGPUによるDICOMからの深度画像生成と評価

    矢野, 大貴, 小枝, 正直, 大西, 克彦, 登尾, 啓史 第80回全国大会講演論文集 2018 (1), 241-242, 2018-03-13

    本研究では共同研究として開発中の肝臓手術サポートシステムにおける深度画像の取得手法を提案し,実装を行った.従来手法では,DICOM画像からSTLモデルを術前に生成し,そのSTLモデルのZバッファから深度画像を取得して,焼きなまし法を用いて肝臓の位置姿勢を推定していた.しかし,手動でのSTLモデル生成は非常に煩雑で時間のかかる作業であり,データの劣化も発生する.一方,STLモデルを半自動で生成する…

    情報処理学会

  • 短距離古典分子動力学シミュレーションコードのGPGPU化(2)

    中川 恒 アンサンブル 20 (1), 40-45, 2018-01-31

    ...<p>本連載では短距離古典分子動力学シミュレーションコードのGPGPU化の方法について解説する.連載第二回目はVerletリスト構築のGPGPU化について簡単に説明した後,CPUとGPUとの間の通信の最適化,負荷をCPUとGPUとの間で分散する方法について説明する.最後に実アプリケーションのGPGPU化の事例について紹介し,GPGPU 化による高速化の度合いについて見ていく.</p>...

    DOI Web Site

  • GPGPUを用いた強化学習エージェントの並列進化シミュレーション

    千賀 喜貴, 森山 甲一, 武藤 敦子, 松井 藤五郎, 犬塚 信博 人工知能学会全国大会論文集 JSAI2018 (0), 2P103-2P103, 2018

    ...<p>GPGPUは、モニタ上のピクセルの色を並列に計算するために膨大な数のプロセッサコアを持つGPUを使用した並列計算技術です。 先行研究では、GPGPUを使用して、進化のシミュレーションでの適応度を計算するための強化学習エージェントを並列化しました。 それによりシミュレーションの実行速度が大幅に向上しました。 しかし、進化部分はCPUで逐次計算され、GPU間の通信はすべての世代で起こりました。...

    DOI

  • GPUによるモンテカルロ法を用いた生体組織光伝播シミュレーション

    鈴木 志歩, 鷲尾 利克, 黒田 輝, 松前 光紀 生体医工学 Annual56 (Abstract), S58-S58, 2018

    <p>モンテカルロシミュレーションとは乱数を用いた確率的手法で,生体組織内の光伝播の計算に用いられており,光拡散方程式の解法の標準手法として確立されている.しかしこの手法には計算時間が長いという欠点がある.</p><p>一方,GPGPU(GPUによる汎用計算)はGPUを画像処理以外に応用する技術であり,計算資源にGPUを用いて実行時間の短縮をする.そこで本研究はGPUを用いた生体組織における光伝…

    DOI

  • 保存型 CIP 法による多相流の効率的な非構造格子数値計算モデル

    池端 昭夫, 清水 友哉, 肖 鋒 日本計算工学会論文集 2018 (0), 20180001-20180001, 2018

    ...この数値計算フレームワークのアルゴリズムの簡易性により、GPGPUアクセラレーションやMPI並列計算への実装は極めて容易である。我々は衛生陶器製品における複雑流路の非構造格子モデルを用いて計算効率のテストを実施した。本テストにより、一般的なPCクラスタにおいて、GPGPU加速率および並列計算スケーラビリティの両方において新しく開発されたコードは十分な性能を発揮することが分かった。...

    DOI

  • 高精度なオフセット面の生成手法

    北原 広, 金子 順一, 鰺坂 昌広, 阿部 壮志, 堀尾 健一郎 年次大会 2018 (0), S1310001-, 2018

    <p>Sculptured surface on large-scale dies with complex curved surface such as automobile body parts is usually fabricated by ball-end-mill using 3-axis NC milling machines. Normally, toolpath for …

    DOI Web Site

  • GPUクラスタにおける大規模SOMの実装に関する基礎的検討

    加藤 聡 日本知能情報ファジィ学会 ファジィ システム シンポジウム 講演論文集 34 (0), 400-402, 2018

    <p>SOMを用いて大規模データの分析を行う場合、並列・分散処理によってSOMの学習アルゴリズムを高速に実行することが有効である。本研究ではこれまで、バッチ学習型のSOMに対して、入力データの集合をいくつかに分割し、入力データ群の部分集合を個別の計算ノードに割り当てて勝者ノードの決定やコードベクトル更新量の算出などを行い、SOMの学習を並列に行う手法を提案した。さらに、各計算ノードにおいて、SO…

    DOI Web Site

  • GPU を用いた濡れた毛髪の対話的なアニメーション生成

    西濱 高志, 床井 浩平 画像電子学会年次大会予稿集 46 (0), 28-28, 2018

    水と毛髪の相互作用によるヘアシミュレーションを対話的に行う手法について報告する.提案手法は毛髪を質点と線 分の集合として近似し,ばねダンパモデルを用いて質点の運動をシミュレーションすることにより,頭髪の形状変化 を再現する.また,毛髪の運動に関与する流体の運動や毛髪の湿潤効果の再現には,格子法にもとづくシミュレーシ ョン手法を用いる.これらにより,提案手法は毛髪への …

    DOI

  • 実空間と整合する超多眼系における再構成品質の評価

    須田 聖也, 児玉 和也, 浜本 隆之 映像情報メディア学会年次大会講演予稿集 2018 (0), 12A-4-, 2018

    ...Then, reconstruction quality of our practical implementation on a GPGPU for real-time interpolation of light fields from inexpensive sparse camera arrays is evaluated in detail....

    DOI

  • HAShCache

    Adarsh Patil, Ramaswamy Govindarajan ACM Transactions on Architecture and Code Optimization 14 (4), 1-26, 2017-12-18

    ...<jats:p>Integrated Heterogeneous System (IHS) processors pack throughput-oriented General-Purpose Graphics Pprocessing Units (GPGPUs) alongside latency-oriented Central Processing Units (CPUs) on the same...

    DOI Web Site 被引用文献1件

  • バリア同期と共有メモリを備えたGPGPUプログラム合成器Kani-CUDA

    蟹, 暁, 朝倉, 泉, 増原, 英彦, 青谷, 知幸 情報処理学会論文誌プログラミング(PRO) 10 (5), 5-5, 2017-11-14

    ...GPGPUとはGPUを汎用計算のために用いる技術であり,高い並列性によって大規模な計算を高速に行うことができる.しかし,GPGPUプログラミングは一般的なプログラミングよりも記述が複雑であり正しさを確信することが難しい.たとえば,共有メモリを用いたブロッキング最適化におけるメモリアドレスの計算式が複雑になることや,非同期的に実行されるスレッド間でメモリ競合が起きないことの確認などである.このような難...

    情報処理学会

  • 短距離古典分子動力学シミュレーションコードのGPGPU化(1)

    中川 恒 アンサンブル 19 (4), 267-273, 2017-10-31

    ...<p>本連載では短距離古典分子動力学シミュレーションコードのGPGPU 化の方法について解説する. 連載第一回目は短距離古典分子動力学シミュレーションの基本アルゴリズムについて概観したのち, ホットスポットである相互作用計算のGPGPU 実装と最適化手法について紹介する.</p>...

    DOI Web Site

  • GLoop

    Yusuke Suzuki, Hiroshi Yamada, Shinpei Kato, Kenji Kono Proceedings of the 2017 Symposium on Cloud Computing 2017-09-24

    DOI Web Site 被引用文献1件 参考文献32件

  • アクセラレータ用暗号開発ツールSPT

    岩井 啓輔, 渡部 匡, 田中 秀磨, 黒川 恭一 電子情報通信学会論文誌D 情報・システム J100-D (6), 627-638, 2017-06-01

    電子化されたデータを保護するための暗号処理技術は,あらゆるデバイスで使用されている.この処理を効率良く行うためには,アクセラレータの有効活用が不可欠である.特定の処理を加速するアクセラレータは,汎用プロセッサと組み合わせて,組み込みプロセッサから計算サーバまで広く使用されている.しかし,アクセラレータはプログラミングが難しく,アーキテクチャが多彩なため,それぞれのデバイスに合わせたチューニングも…

    DOI

  • SC-DCNN

    Ao Ren, Zhe Li, Caiwen Ding, Qinru Qiu, Yanzhi Wang, Ji Li, Xuehai Qian, Bo Yuan ACM SIGPLAN Notices 52 (4), 405-418, 2017-04-04

    ...To overcome this obstacle, considerable research efforts have been made to develop highly-parallel and specialized DCNN accelerators using GPGPUs, FPGAs or ASICs....

    DOI Web Site 被引用文献1件

  • GPGPUを用いたMASの高速アルゴリズムライブラリの実装

    吉川, 翔子, 大岩, 朗, 芳賀, 博英 第79回全国大会講演論文集 2017 (1), 43-44, 2017-03-16

    ...エージェントとの関係を計算するモデルは実行時間が莫大になってしまう.そこで,このようなモデルに適した高速アルゴリズムとしてImproving Boids Algorithmというアルゴリズムがある.本研究ではこのImproving Boids AlgorithmをGPUを用いて実装し,MASのプログラマが容易に用いることができるライブラリを作成した.本ライブラリを現在我々が開発している,RubyでGPGPU...

    情報処理学会

  • CUDAによる並行処理のためのデータ転送のスケジューリング手法の提案

    甲田, 亮太, 杉野, 栄二, 猪股, 俊光, 成田, 匡輝, 新井, 義和, 今井, 信太郎 第79回全国大会講演論文集 2017 (1), 57-58, 2017-03-16

    ....しかし,その効果は命令の依存関係と発行順序に依存し,GPGPUアプリケーション開発を難しくしている.本研究ではCUDAでの複数タスク並行におけるデータ転送のスケジューリング手法の提案を行い,GPGPUアプリケーションの開発の簡易化を図る....

    情報処理学会

  • 床指紋を用いた室内位置推定手法の高速化

    藤田, 貴大, 藤田, 悟 第79回全国大会講演論文集 2017 (1), 449-450, 2017-03-16

    ...そのため、本研究では床指紋の照合にGPGPUなどを用いて並列処理を行うことで実行時間を短縮しリアルタイム性の向上を目指す。また、床指紋の照合で行なわれている特徴点マッチングのペア数を増やすことで、今まで床指紋の照合に失敗した床面でも正しく照合を行う方法の確立を目指す。...

    情報処理学会

  • 単純なデータ構造を用いたCUDAのためのDelaunay三角形分割計算手法

    石河, 孝太, 山本, 修身 第79回全国大会講演論文集 2017 (1), 283-284, 2017-03-16

    ...本稿では,平面上に与えられたn個の点によるDelaunay三角形分割を構成するために,GPGPU向けの並列計算環境CUDAを用いた幾何アルゴリズムを提案する.近年GPUを用いた高速化が色々な分野で試みられている.本稿では,計算幾何学におけるDelaunay三角形分割の計算が,GPUによりどれだけ高速化されるのかを追究する.GPUの性能を最大限に引き出すために,空間分割法という単純なデータ構造で実現される...

    情報処理学会

  • GPGPUを用いた2人ゲームにおける強化学習の高速化

    黒木, 是冶, 森山, 甲一, 武藤, 敦子, 犬塚, 信博 第79回全国大会講演論文集 2017 (1), 631-632, 2017-03-16

    ...そのため本研究では複雑なエージェントを用いるシミュレーションに2人ゲームにおける強化学習を選び、GPGPUを用いたいくつかの手法で高速化し、比較を行った。...

    情報処理学会

  • GPUスパコンを用いた廃棄物埋立層内の数値流体シミュレーション

    鈴木 和将, Huynh Quang Huy Viet, 水藤 寛 廃棄物資源循環学会研究発表会講演集 28 (0), 387-, 2017

    ...さらに、GPGPUコンピューティングによる計算の高速化を試みた。連立一次方程式の求解にはGPBi-CG法を導入し、マルチGPUを利用して高速並列計算によるシミュレーションを行った。...

    DOI

  • GPGPU による有限要素法動解析の陰解法と陽解法の演算性能評価

    松村 一輝, 蒋 飛, 陳 献, 大木 順司 計算力学講演会講演論文集 2017.30 (0), 134-, 2017

    GPU を用いて有限要素法動解析の陰解法と陽解法プログラムの並列化を行った.要素剛性マトリックスの計算は要素ごと,全体剛性マトリックスの組み立ては非零要素ごとに一つのスレッドを割り当てる手法を提案した.物性値が筋肉の四角柱モデルに強制変位を与えた場合の演算時間の比較を行った結果,陽解法の方が解析時間が短いことを確認した.

    DOI Web Site

  • GPGPUによるMaxSATオラクルを用いたSATソルバの試作

    山口 順也, Tourret Sophie, 井上 克巳 人工知能学会全国大会論文集 JSAI2017 (0), 1M2OS02b3-1M2OS02b3, 2017

    ...<p>SAT問題を解くSATソルバは,近年の著しい性能向上によって大規模なSAT問題を解くことが出来るようになった.さらなる高速化の方法として処理の並列化が考えられるが,求解には逐次処理が多く,GPGPUによる並列化によって飛躍的に進歩した事例はない.本研究では,GPGPUで実装したMaxSATソルバをオラクルとして,SAT問題の探索空間を効率的に探索するSATソルバの提案を行う.</p>...

    DOI

  • マルチカラー体積型ホログラムのマルチ GPU を用いた高速計算

    齋藤 正輝, 廣橋 美葵, 山口 健, 吉川 浩 画像電子学会研究会講演予稿 16.04 (0), 154-157, 2017

    体積型ホログラムは波長選択性があり,白色光による特定の波長再生が可能なことが知られている. 本報告では,緑と赤のレーザによる時分割多重露光を行い,マルチカラー化を行った.また,CGH 計算において, 一定の領域ごとに分割したホログラムを複数の GPU で並列して計算させることにより,CPU のみで計算した場合 と比較して最大 131 倍,高速化することができた.

    DOI Web Site

  • 機械学習を用いた内視鏡画像自動診断

    Mori Kensaku, Oda Masahiro, Misawa Masashi, Mori Yuichi, Kudo Shinei 生体医工学 55Annual (4PM-Abstract), 344-344, 2017

    ...パーセプトロン、統計的パターン認識に始まる機械学習は長年研究が行われてきたが、GPGPUなどに代表される手軽なハイパフォーマンスコンピューティング技術の発展により、非常に複雑なアーキテクチャを持つニューラルネットワークを用いたパターン認識などが可能となった。一方、内視鏡画像の診断には高度な技術が必要とされ、医師間の差による診断のブレも発生する。...

    DOI

  • 被切削対象物の弾性変形高速評価システムの開発

    小宮 賢士, 金子 順一, 横山 哲也, 浅野 哲也, 東野 千春, 堀尾 健一郎 年次大会 2017 (0), G1400104-, 2017

    <p>The deformation of the object to be cut has a significant influence on the dimensional accuracy of the finished shape, especially when it is low stiffness. Various attempts have been made to …

    DOI Web Site

  • An Online Rolling Model for Plate Mill Using Parallel Computation

    Otsuka Takayuki, Sakamoto Masashi, Takamachi Yasuyuki, Higashida Yasuhiro, Segawa Yuji, Takeshima Shohta ISIJ International 57 (11), 2042-2048, 2017

    ...</p><p>In addition, for eliminating the convergence loop, an attempt has been made introducing a multi thread computing using General Purpose computing on Graphic Processing Unit (GPGPU)....

    DOI Web Site 被引用文献2件 参考文献14件

  • GPUrpc

    Yuki Iida, Yusuke Fujii, Takuya Azumi, Nobuhiko Nishio, Shinpei Kato ACM Transactions on Embedded Computing Systems 16 (1), 1-25, 2016-10-13

    ...Programming frameworks for general-purpose computing on GPUs (GPGPU), such as CUDA and OpenCL, are also maturing....

    DOI Web Site 参考文献18件

  • GPGPUによるレインボーテーブル生成の高速化

    兼松, 卓也, 桑原, 寛明, 上原, 哲太郎, 國枝, 義敏 コンピュータセキュリティシンポジウム2016論文集 2016 (2), 1260-1267, 2016-10-04

    ...4 文字のパスワードに対応するレインボーテーブルを提案手法によって生成し,GPGPU による高速化の効果を示す.生成したレインボーテーブルを用いてパスワード解析を行い,効率化による解析時間の変化を示す....

    情報処理学会

  • 認証付き暗号MinalpherのGPGPU実装

    小杉, 真紀子, 佐藤, 証 マルチメディア,分散協調とモバイルシンポジウム2016論文集 2016 1272-1275, 2016-07-06

    ...の分野で広く利用されている GPGPU を用いて Minalpher を実装した.現在認証付き暗号の事実上の標準アルゴリズムとして利用されている AES - GCM と処理速度を比較し,速度性能における Minalpher の優位性を示した....

    情報処理学会

  • GeSdA―GPU上でのAutoencoder処理並列化による高速Deep Learningの実装

    中山, 浩太郎, 松尾, 豊 情報処理学会論文誌データベース(TOD) 9 (2), 46-54, 2016-06-29

    「Deep learning」は,その強力な表現学習能力により画像処理・人工知能研究などを中心に幅広い分野で多大な注目を集めている.特に画像処理の分野を中心に,畳込みニューラルネットワーク(CNN)を基盤としたモデルについては多くの研究が精力的に進められ,高速化などの最適化においても顕著な成果が出ている.しかし,CNNと比較するとSdAなどの他のモデルに対するパフォーマンスの最適化についてはいま…

    情報処理学会

  • Cambricon

    Shaoli Liu, Zidong Du, Jinhua Tao, Dong Han, Tao Luo, Yuan Xie, Yunji Chen, Tianshi Chen ACM SIGARCH Computer Architecture News 44 (3), 393-405, 2016-06-18

    ...NN techniques are conventionally executed on general-purpose processors (such as CPU and GPGPU), which are usually not energy-efficient since they invest excessive hardware resources to flexibly support...

    DOI Web Site 被引用文献1件

  • 非線形方程式求根アルゴリズムの宣言的形式言語の設計

    嶋吉, 隆夫, 天野, 晃 情報処理学会論文誌プログラミング(PRO) 9 (3), 24-24, 2016-06-06

    ...近年,数値計算が行われる環境は,クラスタPCやGPGPU(general-purpose computing on graphics processing units),クラウドコンピューティングなど非常に多様化している.そこで用いられる数値計算アルゴリズムは一般的に,手続き型プログラミング言語を用いて実装されたライブラリの形態で配布,利用される.このやり方は,計算性能の面で有利であるが,一方で,計算実行環境...

    情報処理学会

  • PEACH3の通信性能測定

    金田, 隆大, 鶴田, 千晴, 塙, 敏博, 天野, 英晴 第78回全国大会講演論文集 2016 (1), 169-170, 2016-03-10

    ...近年、Graphics Processing Unit(GPU)を汎用計算に用いるGeneral-purpose computing on graphics processing units(GPGPU)をハイパフォーマンスコンピューティングに利用する事が一般化しているが、ノードをまたぐGPU間通信は大きな遅延を生じる。...

    情報処理学会

  • GPGPUによる電位・電界シミュレーションの高効率化

    松原, 翼, 上嶋, 明, 尾崎, 亮, 小畑, 正貴 第78回全国大会講演論文集 2016 (1), 213-214, 2016-03-10

    ...CPUと比べてピーク性能が高く,かつ価格性能比でも優れたGPUによる汎用計算(GPGPU)に注目が集まっている。本研究では,膨大な計算量が必要な電位・電界シミュレーションを,CUDAによりGPU(Tesla K40)上に実装して高速化を試みた。...

    情報処理学会

  • GPUを用いた類似画像検索の高速化

    草村, 優太, 小澤, 佑介, 天笠, 俊之, 北川, 博之 第78回全国大会講演論文集 2016 (1), 211-212, 2016-03-10

    ...画像集合の中からクエリ画像と視覚的に類似した画像を見つけ出す処理を,類似画像検索と呼ぶ.近年の類似画像検索は画像から抽出される特徴量を用いて行うことが主流であり,一つの画像は数百から数千程度のベクトルで表現される.そのため,特徴量の抽出や比較演算には多くの時間を要するという問題がある.そこで,処理時間を短縮するために,GPGPUという技術を用いる.GPGPUとは,GPUの並列処理性に着目して汎用計算...

    情報処理学会

  • PCI Express拡張Boxと仮想GPUとの計算性能比較

    瀬戸口, 幸寿, 成見, 哲 第78回全国大会講演論文集 2016 (1), 205-206, 2016-03-10

    ...GPUを科学計算などの汎用的な目的で使用する技術はGPGPU(General-Purposecomputing on Graphics Processing Units)として知られている.DS-CUDA(Distributed Shared CUDA)はネットワークを通じたサーバ上のGPUを仮想化するミドルウェアで,クライアント側でソフトを書き換えることなくGPU資源を用いたGPGPUが可能である...

    情報処理学会

  • GPGPU-Simの並列化

    川井, 博斗, 味曽野, 智礼, 吉瀬, 謙二 第78回全国大会講演論文集 2016 (1), 141-142, 2016-03-10

    ...そこで本稿では、主要なGPUシミュレータであるGPGPU-Simを並列化し高速化する手法について検討する。...

    情報処理学会

  • GPGPUフレームワークMESI-CUDAのマルチGPU環境への対応

    山本, 怜, 大野, 和彦 情報処理学会論文誌プログラミング(PRO) 9 (1), 12-12, 2016-02-26

    GPGPUの分野において,複数のGPUを搭載したマルチGPU環境を用いてより高い計算性能を実現する試みがなされている.現在主流の開発環境であるCUDAはマルチGPUに対応しているが,個々のGPUを明示的に操作する必要があり,プログラムの記述が煩雑になる.さらに,1台のホスト上に搭載できるGPUの個数が限られているため,より多くのGPUを利用する大規模な環境は分散型マルチGPU環境となる.この場合…

    情報処理学会

  • Development of Intra-operative ultrasound navigation system for laparoscopic liver surgery

    Onogi Shinya, Ikeda Tetsuo, Arata Jumpei, Oguri Susumu, Nakadate Ryu, Akahoshi Tomohiko, Mitsuishi Mamoru, Hashizume Makoto 生体医工学 54Annual (Proc), 3T4-3-1-1-3T4-3-1-2, 2016

    <p>In laparoscopic liver surgery, laparoscopic ultrasound (LUS) is indispensable to understand inner structure such as vessels and tumors. However, LUS is not convenient due to poor operability, and …

    DOI

  • GPUを利用したテンソルネットワーク計算ライブラリの開発

    森田 悟史, 大久保 毅, 五十嵐 亮, 原田 健自 日本物理学会講演概要集 71.2 (0), 2893-2893, 2016

    ...<p>テンソルネットワーク法は量子多体問題の数値計算手法において,近年精力的に研究,開発が行われている.フラストレート系など興味深い問題を取り扱うためには,ボンド次元を増やし精度を上げる必要があるが,膨大な計算量およびメモリ量が必要となる.そのため,我々はテンソルネットワーク法に特化した分散メモリ上の並列計算ライブラリを開発している.今回,テンソル縮約演算に対しGPGPU化したコードを開発したので,...

    DOI

ページトップへ