凸多面体を用いた次元縮小法と高次元索引機構

書誌事項

タイトル別名
  • トツタメンテイ オ モチイタ ジゲン シュクショウホウ ト コウジゲン サクイン キコウ
  • Dimensionality Reduction Technique with Convex Polyhedra and High - dimensional Index Structure

この論文をさがす

抄録

本稿では,高次元データの非均一性に着目した新しい次元縮小法とそれを用いた索引機構を提案する.提案手法は,データ空間の凸多面体によって次元縮小を行う.この手法の特徴は,局所的に次元を縮小する点にあり,それによりコンパクトな索引構造の実現が可能となる.この手法の有効性を示すため,本稿では提案手法をVA-file に適用した新しい索引構造CVA-file(Compact VA-file)を考案した.この索引構造は次元縮小法によって索引ファイルを大幅に縮小する.また,凸多面体の幾何的性質を利用して,各データの縮小した次元の境界(bound)を計算することにより,精度を保ちながら索引ファイルを縮小することが可能になる.実データを用いた実験ではCVA-?le は主成分抽出により全局次元縮小法から構成したKL(Karhunun Loeve ransform)空間のVA-file やSR-treeより良い結果を示した.

This paper proposes a new dimensionality reduction technique and an indexing mechanism for high dimensional data sets in which data points are not uniformly distributed.The proposed technique decomposes a data space into convex polyhedra,and the dimensionality of each data point is reduced according to which polyhedron includes the data point.One of the advantages of the proposed technique is that it reduces the dimensionality locally This local dimensionality reduction contributes to improve indexing mechanisms for non-uniformly distributed data sets.o show the applicability and the effectiveness of the proposed technique, this paper describes a new indexing mechanism called CVA-file (Compact VA-File)which is a revised version of the VA-file.With the proposed dimensionality reduction technique, the size of data points stored in index files can be reduced.Furthermore,it can estimate upper and lower bounds of each entry in index files by using geographic properties of convex polyhedra.Results from experimental simulations show that the CVA-file is better than VA-file with dimensionality reduction using KL(Karhunun Loeve ransform)and SR-tree for non-uniformly distributed real data sets.

収録刊行物

被引用文献 (1)*注記

もっと見る

参考文献 (11)*注記

もっと見る

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ