球面k-mean++法について

書誌事項

タイトル別名
  • On Spherical k-Means Clustering
  • 球面k-means++法について
  • キュウメン k-means++ホウ ニ ツイテ

この論文をさがす

抄録

k-means(KM)法は強力なクラスタリング手法だが、強い初期値依存性を持つ。この問題を解決するため、2007年にk-means++法(KM++)が提案された。ところで、文書データは一般的に球面上にマッピングされて処理されるが、ビッグデータをはじめ近年着目されているインターネット上のデータの多くは文書データであり、そのような球面上に分布するデータをクラスタリングする手法である球面k-means法(SKM)が2012年にされている。SKMも有効な手法であり、近年のデータ処理に対する要求を考えるとKMより注目されていると言えるが、KMと同様、強い初期値依存性を有する。そこで本報告ではその問題を解決するため、(1)三角不等式を満たす非類似度を導入することによってSKMを拡張し、(2)拡張されたSKMに基づいた球面k-means++法(SKM++)を提案する。SKM++の有効性は理論的に保証される。

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ