データマイニングのアルゴリズム記述を容易にする拡張行列演算の提案

書誌事項

タイトル別名
  • データマイニング ノ アルゴリズム キジュツ オ ヨウイ ニ スル カクチョウ ギョウレツ エンザン ノ テイアン
  • Extended Matrix Operations for Describing Data Mining Algorithms

この論文をさがす

抄録

計算機性能の向上およびそれにともなうデータ量の増加により,知識発見,データマイニングの重要性が高まってきている.その処理には多くのメモリ,高い演算能力が必要とされ並列分散化の必要があり,個々の問題に対しては様々な並列分散化が施されている.しかし,一般に並列分散アルゴリズムの記述を行うことは難しい.本研究では,データマイニングにおける並列分散アルゴリズムの記述を容易にすることを目的として,「拡張行列演算」と呼ぶ並列アルゴリズム記述の枠組みを提案する.この枠組みは行列演算の加算および乗算の演算子を一般化したものである.枠組みの持つ計算パターンは少ないが,行列演算のアナロジがアルゴリズム記述を容易かつ簡潔にしており,また問題に対し適切な演算子を定義することができるためそのその表現力は高い.行列計算の並列化に関する研究は多く,同様にこの枠組みの分散並列化も行うことができる.計算パターンが少ないことはプログラムの代数的な取扱いが容易となる利点も持つ.本論文では,枠組みの概要,いくつかのデータマイニングのアルゴリズム記述例を示し,実験を通してこの枠組みの有用性を示す.

The increase of machine power and the existence of the concomitant huge-sized database have made knowledge discovery and data mining possible and more important. Processing such massive date requires huge computational power and memory as well, which calls for distributed and parallel treatments. Although there have been many case studies of parallelizing data mining algorithms in ad hoc manners, describing parallel and distributed data mining algorithms is still a hard task. In this paper, we propose a framework, called extended matrix operations, for describinig parallel and distributed data mining algorithms in a general and uniform way. This framework is a generalization of matrix operations whose operators of addition and multiplication are generalized. This framework has the following advantages: analogy to usual matrix operations makes intuitive and concise description of algorithms; user can implement many algorithms through giving proper definitions of the generalized operators; limited number of computation patterns makes algebraic treatments of programs easy. Matrix operations have a large number of researchs on parallelization, which also apply to our framework. We explain the framework and demonstrate how concisely data miming algorithms are described in our framework. Effectiveness of our framework is examined by experiments.

収録刊行物

関連プロジェクト

もっと見る

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ