金田 康正 Kanada Yasumasa

ID:1000090115551

東京大学情報基板センター Information Technology Center The University of Tokyo (2014年 CiNii収録論文より)

Search authors sharing the same name

Articles:  1-20 of 62

  • 1 / 4
  • Extraction of Curves from a Grayscale Image  [in Japanese]

    INOUE Yuki , KANEDA Yasumasa

    本研究ではグレースケール画像に対してどのような手法で曲線を抽出し表現するかを議論し,また,どのように画像の要素を分解すればより自然な曲線の抽出につながるかを検討する.そして,分解した要素ごとに曲線で近似し画像がどのような構成をしているかを論理的に表現する.

    Technical report of IEICE. PRMU 113(493), 277-282, 2014-03-13

  • Improvement and Evaluation of MBPS Using Multiple Polynomials on HITACHI SR11000/J2  [in Japanese]

    YOSHIDA Hitoshi , KURODA Hisayasu , USHIRO Yasunori , KANADA Yasumasa

    現在,インターネットにおけるSSL通信をはじめとして広く用いられている公開鍵暗号システムの一つであるRSA暗号のように,素因数分解の難しさを安全性の根拠にしている暗号システムが多数あり,その安全性の指標として高速な素因数分解の研究が行われてきている.本研究では,一般数体飾法に代わる新たな因数分解方法として提案している多数基底多項式篩法(MBPS; Multiple Base Polynomial …

    IEICE technical report 108(180), 103-107, 2008-08-05

    References (5)

  • Implementation and Evaluation of FFT Using Improved Quadruple Precision Arithmetic on SR11000/J2  [in Japanese]

    TSUTSUI NAOKI , YOSHIDA HITOSHI , KURODA HISAYASU , KANADA YASUMASA

    浮動小数点演算で扱う数値は計算機上で有限桁の取り扱いとなるため,一般的には演算毎に誤差が発生する.それで計算精度を高めるために4倍精度演算を使用することがあるが,4倍精度演算はソフトウェアによるエミュレーションで実現されることが大半のため,ハードウェアで実現される倍精度演算と比べてかなり遅くなる.本研究は,これまで行ってきているベクトルデータに対する4倍精度演算の高速化で提案した手法を,4倍精度F …

    IPSJ SIG Notes 116, 61-66, 2008-08-05

    References (15)

  • Fast Multiply-add Operation with Quadruple Precision on SR11000/J2  [in Japanese]

    NAGAI TAKAHIRO , YOSHIDA HITOSHI , KURODA HISAYASU , KANADA YASUMASA

    並列計算機の性能向上や数値計算法の進展は,大規模科学技術計算における大きな鍵となっている。特に浮動小数点数における演算においては、計算規模が増すに従ってより多くの計算量を必要とし、計算誤差も増大する。そのために、倍精度演算より有効桁数が多い 4 倍精度演算の必要性が高まってきており注目されている。4 倍精度数の表現には、倍精度浮動小数点数を 2 つ用いて表される 128 ビットデータ型があるが、S …

    情報処理学会論文誌コンピューティングシステム(ACS) 48(SIG13(ACS19)), 214-222, 2007-08-15

    IPSJ  References (7) Cited by (4)

  • An Optimizing Method with SIMD Instruction Set for Program with Complex Control Structure  [in Japanese]

    HIROMATSU YUSUKE , KURODA HISAYASU , KANADA YASUMASA

    近年の汎用プロセッサの多くは,複数のパックされたデータを1命令で演算可能なSIMD(Single Instruction Multiple Data)命令セットを搭載している.この命令セットはデータの並列性を利用して,大量のデータを通常の命令よりも高速に処理することが可能である.そのため,マルチメディア処理や数値計算処理の高速化に利用されている.これまで,自動解析によってSIMD命令セットを使った …

    情報処理学会論文誌プログラミング(PRO) 48(SIG4(PRO32)), 62-72, 2007-03-15

    IPSJ  References (15) Cited by (1)

  • Discussion about Selecting Parameters in Computing π(x)  [in Japanese]

    YOSHIDA HITOSHI , KURODA HISAYASU , KANADA YASUMASA

    与えられたχ以下の素数を数える関数π(χ)は,関数自身の定義や近似式を求めることが非常に単純であるのに対し、正確な値を求めることは非常に困難なことである。本研究では、π(χ)を求める一つの手法において、計算工程にかかる時間や必要メモリ量を変動させるパラメータを様々に変化させ、理論的に導かれる最適化パラメータとの違いを見る。最終的にはπ(10^<11>),π(10^<12>) …

    IPSJ SIG Notes 108, 1-6, 2006-10-05

    References (8)

  • GMRES method considering the calculation accuracy  [in Japanese]

    KAMIYA KAZUNORI , KURODA HISAYASU , KANADA YASUMASA

    連立一次方程式の反復解法の問題点の一つは行列によっては実用的な反復回数以内に収束に至らない点である.その原因としては行列の特性が挙げられるが,途中の行列ベクトル演算の計算精度も収束に影響が与えている可能性がある.本研究ではGMRES法の収束特性が行列ベクトル演算の計算精度によりどのように影皆をうけるか実験的に評価した.計算精度は積和演算における情報落ち誤差を補償する方法,浮動小数点数の精度を設定す …

    IPSJ SIG Notes 93, 101-106, 2003-03-11

    References (7)

  • Implementation of FFT by Interpolation  [in Japanese]

    MAEDA TAKASHI , KURODA HISAYASU , KANEDA YASUMASA

    一般にFFT(高速フーリエ変換)のアルゴリズムは基底を2とする長さの場合に最も計算効率が良く,混合基底の長さの場合においても,良い性能が発揮できるFFTのアルゴリズムは数多く考案されている.しかし,長さが素数の場合は最も計算効率が悪く,計算効率が良い場合と比較して計算時間は極端に長くなる.このようなFFTの一般的性質を踏まえ,任意の個数の標本値から補間によって2のべき乗個の標本値を生成し,これに対 …

    IPSJ SIG Notes 93, 89-94, 2003-03-11

    References (7)

  • Direct Solver for Sparse Linear Equations with Dynamic Block Size Selection  [in Japanese]

    NISHIDE RYUJI , KATAGIRI TAKAHIRO , KANADA YASUMASA

    LU分解の一手法であるスーパーノードアルゴリズムに,ブロック幅を最適化する自動チューニング機構を採用した.5種の異なる計算機でその効果を評価したところ,最大で1.5倍程度の性能差が認められた.このアルゴリズムはブロック化された内積形式ガウス法の一種であるが,ブロック幅の最適値を自動探索する機構は利用者の負担を軽減し,求解までの時間を短縮するために必要不可欠である.また最適値として選択された値はアー …

    IPSJ SIG Notes 147, 157-162, 2002-03-07

    References (13)

  • The Effect of Optimal Algorithm Selection of Parallel Sparse Matrix-Vector Multiplication  [in Japanese]

    KUDOH MAKOTO , KURODA HISAYASU , KATAGIRI TAKAHIRO , KANADA YASUMASA

    並列疎行列ベクトル積の性能は行列の構造や計算機の性質に大きく依存するため,これらの性質に合わせた高速化手法で計算することが重要である.本論文では筆者らの作成した複数の高速化手法を含んだ並列疎行列ベクトル秘のルーチンを紹介する.また行列や計算機の性質に応じて最適な高速化手法を選択した場合の性能を,従来法である妥当な固定手法を用いた場合の性能と比較する.4機種の並列計算機上での実験では,最適なアルゴリ …

    IPSJ SIG Notes 147, 151-156, 2002-03-07

    References (11) Cited by (2)

  • The Effect of Optimal Algorithm Selection of Parallel Sparse Matrix-Vector Multiplication  [in Japanese]

    KUDOH MAKOTO , KURODA HISAYASU , KATAGIRI TAKAHIRO , KANADA YASUMASA

    並列疎行列ベクトル積の性能は行列の構造や計算機の性質に大きく依存するため,これらの性質に合わせた高速化手法で計算することが重要である.本論文では筆者らの作成した複数の高速化手法を含んだ並列疎行列ベクトル秘のルーチンを紹介する.また行列や計算機の性質に応じて最適な高速化手法を選択した場合の性能を,従来法である妥当な固定手法を用いた場合の性能と比較する.4機種の並列計算機上での実験では,最適なアルゴリ …

    IPSJ SIG Notes 22, 151-156, 2002

    Cited by (1)

  • Impact of Auto-tuning Facilities for Parallel Numerical Library  [in Japanese]

    KATAGIRI TAKAHIRO , KURODA HISAYASU , OHSAWA KIYOSHI , KUDOH MAKOTO , KANADA YASUMASA

    数値計算において高性能を達成するため, 現在でも多くの技法を用いてチューニングがなされる.この作業自体が時間を浪費するものであったり, また利用する計算機に対する高度な知識が必要となる.本論文ではこのチューニング作業を自動化するため, 並列数値計算ライブラリに自動チューニング機構を付加することを提案する.従来の機構との違いは, (1)分散メモリ型計算機を対象とする;(2)標準化された計算のみの最適 …

    情報処理学会論文誌. ハイパフォーマンスコンピューティングシステム 42(4), 60-76, 2001-11-15

    References (20) Cited by (4)

  • Performance Evaluation of the Parallel Numerical Library of ILIB on a PC-cluster System  [in Japanese]

    KATAGIRI TAKAHIRO , KURODA HISAYASU , KUDOH MAKOTO , KANADA YASUMASA

    本稿では, スーパーコンピュータ用に開発された自動チューニング機能付き並列数値計算ライブラリILIBのPCクラスタ上での性能を評価する.性能評価の結果, ブロック化をしていないルーチンの速度向上は高々1.02倍であったが, ブロック化されたルーチンの自動チューニングによる速度向上が23倍にも及ぶ場合があることが判明した.このことからPCクラスタ上で性能を高めるためには, ブロック化による実装とその …

    IPSJ SIG Notes 87, 19-24, 2001-07-25

    References (18) Cited by (1)

  • スーパーコンピュータの今後の動向  [in Japanese]

    金田 康正 , 住 明正

    大会講演予講集 79, 134, 2001-05-08

  • A Proposal for GCR Methods with Less Memory Requirement  [in Japanese]

    KUDOH MAKOTO , KURODA HISAYASU , KATAGIRI TAKAHIRO , KANADA YASUMASA

    大規模疎行列を係数行列に持つ連立一次方程式の解法には,Krylov部分空間法が広く用いられている.その中でも,係数行列が非対称の場合の解法として,Arnoldi原理に基づいたGCR(Generalized Conjugate Residual)法が知られている.このGCR法の実装に関してリスタート版のGCRや,eGCR(efficient GCR)などが提案されているが,これらの方法を計算量,メモ …

    IPSJ SIG Notes 142, 79-84, 2001-03-08

    References (5)

  • A Proposal for GCR Methods with Less Memory Requirement  [in Japanese]

    KUDOH MAKOTO , KURODA HISAYASU , KATAGIRI TAKAHIRO , KANADA YASUMASA

    大規模疎行列を係数行列に持つ連立一次方程式の解法には,Krylov部分空間法が広く用いられている.その中でも,係数行列が非対称の場合の解法として,Arnoldi原理に基づいたGCR(Generalized Conjugate Residual)法が知られている.このGCR法の実装に関してリスタート版のGCRや,eGCR(efficient GCR)などが提案されているが,これらの方法を計算量,メモ …

    IPSJ SIG Notes 2001(22), 79-84, 2001-03-08

    Cited by (1)

  • Direct Solver for Sparse Linear Equations with Dynamic Block Size Selection  [in Japanese]

    NISHIDE RYUJI , KATAGIRI TAKAHIRO , KANADA YASUMASA

    LU分解の一手法であるスーパーノードアルゴリズムに,ブロック幅を最適化する自動チューニング機構を採用した.5種の異なる計算機でその効果を評価したところ,最大で1.5倍程度の性能差が認められた.このアルゴリズムはブロック化された内積形式ガウス法の一種であるが,ブロック幅の最適値を自動探索する機構は利用者の負担を軽減し,求解までの時間を短縮するために必要不可欠である.また最適値として選択された値はアー …

    IPSJ SIG Notes 2001-HPC-89, 157-162, 2001

    Cited by (1)

  • Performance evaluation of parallel sorting algorithm based on data distribution  [in Japanese]

    YAMAGISHI HIDENORI , KURODA HISAYASU , KANADA YASUMASA

    並列ソートを実行する際に, PE(Processing Element)間に負荷の偏りが生じると, 最も多くのデータを担当するPEにおける処理がボトルネックとなり, 性能を低下させる原因となる.本研究では並列計算機上でよく用いられ汎用性の高いことで知られるレギュラーサンプリングソートアルゴリズムと相性のよい, データの分布に着目した負荷分散手法を提案する.提案する手法は, 通常のレギュラーサンプリ …

    IPSJ SIG Notes 82, 167-172, 2000-08-03

    References (11) Cited by (1)

  • Performance Evaluation of Linear Equations Library on Parallel Computers  [in Japanese]

    KURODA HISAYASU , KATAGIRI TAKAHIRO , KANADA YASUMASA

    我々の開発したGMRES(m)法を利用した連立一次方程式ライブラリでは, 実行性能が最大限になるような最適なパラメータを自動的に設定することができるように設計されている.例えば, 問題の種別や実行プロセッサ台数などはライブラリ実行時になって初めてわかる性質である.本論文ではこのライブラリを利用する上でのインタフェースの概略を示し, いくつかの並列計算機上でその性能を調べた.その結果, 自動選択され …

    IPSJ SIG Notes 82, 35-40, 2000-08-03

    References (7)

  • ILIB_RLU : An Automatically Tuned Parallel Dense LU Factorization Routine and Its Performance Evaluation  [in Japanese]

    OOSAWA KIYOSHI , KATAGIRI TAKAHIRO , KURODA HISAYASU , KANADA YASUMASA

    この論文では数値計算を行う際に用いる, 計算機に適したパラメタを自動的に探し実行する機能を付加した, 並列数値計算ライブラリI-LIB(Intelligent LIBrary)のルーチンのひとつである, 連立一次方程式の求解におけるLU分解ルーチン(ILIB_RLU)の機能と性能について報告する.ILIB_RLUは, 係数行列が疎行列の場合も密行列として扱い直接法によって解くことにより, 行列の性 …

    IPSJ SIG Notes 82, 25-30, 2000-08-03

    References (10) Cited by (2)

  • 1 / 4
Page Top