Search Results 1-20 of 716

  • Emerging Tech : NIKKEI Roboticsから今月の1本 NVIDIAが新アーキテクチャーのGPU「A100」 新浮動小数点形式「Tensor Float 32」を導入  [in Japanese]

    …  A100は汎用の演算コア「CUDA Core」のほかに、ディープラーニングに向けた演算コア「Tensor Core」を搭載する。 …

    日経エレクトロニクス = Nikkei electronics : sources of innovation (1218), 95-97, 2020-08

    Nikkei BP 

  • Multi-hybrid Accelerated Computing with GPU and Reconfigurable System  [in Japanese]

    小林 諒平 , 藤田 典久 , 山口 佳樹 , 朴 泰祐 , 吉川 耕司 , 安部 牧人 , 梅村 雅之

    計算工学講演会論文集 Proceedings of the Conference on Computational Engineering and Science 25, 6p, 2020-06

  • Particle Swarm Optimization for GPU Implementation  [in Japanese]

    佐々木 智志

    電子情報通信学会誌 = The journal of the Institute of Electronics, Information and Communication Engineers 103(5), 524-528, 2020-05

  • Programming on GPU, a General-purpose Compute Accelerator  [in Japanese]

    成瀬 彰

    電子情報通信学会誌 = The journal of the Institute of Electronics, Information and Communication Engineers 103(5), 483-487, 2020-05

  • マーチングキューブ法のマルチGPU上での階層的並列処理  [in Japanese]

    吉川 一輝 , 吉田 明正

    … いて,ポリゴンを貼り付けるセルの選択とそのセル数の計算部分に,CUDA Thrustライブラリのexclusive_scan関数を用いる実装が容易である.しかしながら,この関数はマーチングキューブ法の処理時間の大半を占めており,かつ1GPU実行を前提としている.本研究では,マーチングキューブ法のexclusive_scan関数をマルチGPU向けの独自のCUDAコードにより実装した.NVIDIA Tesla K80の2GPU環境で性能評価を行った結 …

    第82回全国大会講演論文集 2020(1), 121-122, 2020-02-20

    IPSJ 

  • CUDAを用いたMPS法における疎行列格納形式動的選択による高速化  [in Japanese]

    塙 翔登 , 富永 浩文 , 中村 あすか , 前川 仁孝

    … 本研究は,CUDAを用いたMPS法を高速化するために,圧力計算部分の連立方程式求解の係数行列において疎行列格納形式を動的選択する手法を提案する.CUDAを用いたMPS法は,時間ステップごとに粒子情報を反復計算して求めることにより粒子の動きを解析する.また,圧力計算過程における係数行列は,対称疎行列であり,疎行列格納形式を用いることで不要な計算や記憶領域の使用を削減する.本手 …

    第82回全国大会講演論文集 2020(1), 109-110, 2020-02-20

    IPSJ 

  • GPUシステムにおける階層統合型粗粒度並列処理の並列化コンパイラ  [in Japanese]

    渡辺 智之 , 吉田 明正

    … 大きいマクロタスクの実行に対して,コアの代わりにGPUを使用し,プログラム全体の実行時間の短縮を目指す.本研究では,LLVM/Clangを用いた並列化コンパイラを開発しており,その並列化コンパイラを用いてCUDAを伴う並列Cコードを自動生成する.性能評価では,Tesla K80を搭載したXeonサーバ上で,粒子法とヤコビ法のプログラムに対して,並列化コンパイラにより生成した並列コードを用いて性能評価を行った結果, …

    第82回全国大会講演論文集 2020(1), 101-102, 2020-02-20

    IPSJ 

  • Implementation of high speed rainbow table generation using Keccak hashing algorithm on CUDA  [in Japanese]

    グェン ダット トゥオン , 岩井 啓輔 , 松原 隆 , 黒川 恭一

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 119(371), 181-186, 2020-01-22

  • Fast Euclidean Cluster Extraction Using GPUs

    Nguyen Anh , Cano Abraham Monrroy , Edahiro Masato , Kato Shinpei

    … In this paper, we investigate the use of NVIDIA graphics processing units and their programming platform CUDA in the acceleration of the Euclidean clustering (EC) process in autonomous driving systems. …

    Journal of Robotics and Mechatronics 32(3), 548-560, 2020

    J-STAGE 

  • TensorShader : Deep Learning Framework for High-Dimensional Neural Networks  [in Japanese]

    YOSHIMURA Takuma

    … で本研究では,複素数,四元数,3次元ベクトルを基とする深層学習フレームワークを開発した.このフレームワークでは, 高次元ニューラルネットワークを実装する際に課題となる一時計算領域の肥大を解消するため専用のCUDAカーネルを実装し, さらに丸め誤差の蓄積を避けるためFP32-FP32演算を採用した.これらにより,既存のフレームワークに比べ空間計算量と計算誤差の低減について優位であることを示す.</p> …

    Proceedings of the Annual Conference of JSAI JSAI2020(0), 1J5GS201-1J5GS201, 2020

    J-STAGE 

  • GPUDirect RDMAを用いた高信頼な障害検知機構  [in Japanese]

    金本 颯将 , 光来 健一

    コンピュータシステム・シンポジウム論文集 (2019), 23-31, 2019-12-03

    IPSJ 

  • GPU Implementation of CT Image Reconstruction Using Conjugate Gradient Method  [in Japanese]

    松岡 和憲 , 丹治 裕一 , 藤本 憲市 , 北島 博之 , 堀川 洋

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 119(209), 5-9, 2019-09-23

  • Detecting System Failures with GPUs and LLVM

    Ozaki Yuichi , Kanamoto Sousuke , Yamamoto Hiroaki , Kourai Kenichi

    … We have implemented GPUSentinel using CUDA and the Linux kernel and confirmed that GPUSentinel could detect three types of system failures.10th ACM SIGOPS Asia-Pacific Workshop on Systems (APSys 2019), August 19 - 20, 2019 , Hangzhou, China …

    APSys '19: Proceedings of the 10th ACM SIGOPS Asia-Pacific Workshop on Systems, 47-53, 2019-08

    IR 

  • Development of a GPGPU-parallelized hybrid finite-discrete element method for modeling rock fracture

    Fukuda Daisuke , Mohammadnejad Mojtaba , Liu Hongyuan , Dehkhoda Sevda , Chan Andrew , Cho Sang-Ho , Min Gyeong-Jo , Han Haoyu , Kodama Jun-ichi , Fujii Yoshiaki

    International journal for numerical and analytical methods in geomechanics 43(10), 1797-1824, 2019-07

    IR 

  • Development of a method to enhance three-dimensional inner soil structure using ground motion analyses on GPUs  [in Japanese]

    山口 拓真 , 市村 強 , 藤田 航平 , 堀 宗朗 , ラリス ウィジャラトネ

    計算工学講演会論文集 Proceedings of the Conference on Computational Engineering and Science 24, 4p, 2019-05

  • Construction of the GPU Parallel Calculation Environment and Thread Hierarchy Structure  [in Japanese]

    伊藤 誠

    … We constructed the personal parallel calculation environment using GPU and CUDA Toolkit. … It is very important to recognize the concept of Warp of NVIDIA GPU in CUDA programming. … We also showed the relation between number of threads and calculation time, and in the CUDA program the number of the threads in each block must be a multiple of 32(Warp size). …

    大阪産業大学経済論集 = OSAKA SANGYO UNIVERSITY JOURNAL OF ECONOMICS 20(2), 13-25, 2019-03-31

    IR 

  • Construction of the GPU Parallel Calculation Environment and Thread Hierarchy Structure  [in Japanese]

    伊藤 誠

    大阪産業大学経済論集 20(2), 71-83, 2019-03

  • マーチングキューブ法におけるexclusive_scan関数のGPU上での並列処理  [in Japanese]

    吉川 一輝 , 吉田 明正

    … 用いられているが,この関数の実行には多くの処理時間を必要とする.一般的な実装ではCUDAのthrustライブラリexclusive_scan関数を用いることが多いが,本研究ではさらなる高速化を実現するために,exclusive_scan関数を独自のCUDAコードにより並列化した.本手法によるマーチングキューブ法のCUDAプログラムをGPU上で並列実行したところ,ポリゴンモデル形成にかかる処理時間が短縮 …

    第81回全国大会講演論文集 2019(1), 119-120, 2019-02-28

    IPSJ 

  • GPUとLLVMを用いたOSレベルでの障害検知機構  [in Japanese]

    尾崎 雄一 , 山本 裕明 , 光来 健一

    … ムがメインメモリを参照することによってシステムの状態を取得する.OSのソースコードを最大限に利用して検知プログラムを記述可能にするために,LLVMを用いてプログラム変換を行う.Linux,GPUドライバ,CUDAを用いてGPUSentinelを実装し,意図的に発生させた障害が検知できることを確認した.第145回システムソフトウェアとオペレーティング・システム研究発表会, 2019年2月28日~3月1日, 函館コミュニティプラザ, …

    情報処理学会研究報告. [システムソフトウェアとオペレーティング・システム] 2019-OS-145(12), 1-10, 2019-02-21

    IR 

  • Data Provenance for Experiment Management of Scientific Applications on GPU

    Sejin Kim , Jisun Oh , Yoonhee Kim

    IEICE Proceeding Series (56), P2-5, 2019

    DOI 

Page Top