x-means法改良の一提案 : k-means法の逐次繰り返しとクラスターの再併合  [in Japanese] AN EXPANSION OF X-MEANS : PROGRESSIVE ITERATION OF K-MEANS AND MERGING OF THE CLUSTERS  [in Japanese]

Access this Article

Search this Article

Author(s)

    • 石岡 恒憲 Ishioka Tsunenori
    • 独立行政法人 大学入試センター 研究開発部 試験作成支援研究部門 Dept. of Applied Statistics and Measurement, Research Division, The National Center for University Entrance Examinations

Abstract

K-means法の逐次繰り返しとBICによる分割停止基準を用いることで,クラスター数を自動的に決定するアルゴリズムx-means法を改良した.その手続きは,分割順序に起因する好ましくないと考えられる分割クラスターを併合するものである.この併合操作により,さまざまな事例に対して,適当と考えられるクラスター数を得ることのできる事例の数が大幅に増加することが確認された.この方法は,クラスター数未知のときに発見的な方法に拠らずに情報理論的に最適と考えられるクラスター数を求めることができる.その計算量(computational complexity)は標本サイズをN,クラスター数をkとしたとき,ο(N log k)となる.

We expand a non-hierarchical clustering algorithm that can determine the optimal number of clusters by using iterations of k-means and a stopping rule based on BIG. The procedure requires merging the clusters that a k-means iteration has made to avoid unsuitable division caused by the division order. By using this additional merging operation, the case of adequate clustering was increased for various types of simulation runs. With no prior information about the number of clusters, our method can get the optimal clustering based on information theory instead of on a heuristic method. The computational complexity of our method is ο(N log k) for the sample size N and the number of final clusters, k.

Journal

  • Bulletin of the Computational Statistics of Japan

    Bulletin of the Computational Statistics of Japan 18(1), 3-13, 2006

    Japanese Society of Computational Statistics

References:  15

Cited by:  2

Codes

  • NII Article ID (NAID)
    110004818389
  • NII NACSIS-CAT ID (NCID)
    AN10195854
  • Text Lang
    JPN
  • Article Type
    Journal Article
  • ISSN
    0914-8930
  • NDL Article ID
    8070080
  • NDL Source Classification
    ZM13(科学技術--科学技術一般--データ処理・計算機)
  • NDL Call No.
    Z14-1382
  • Data Source
    CJP  CJPref  NDL  NII-ELS  J-STAGE 
Page Top