許容範囲付きデータに対するハードクラスタリング

  • 濱砂 幸裕
    筑波大学大学院システム情報工学研究科リスク工学専攻
  • 遠藤 靖典
    筑波大学大学院システム情報工学研究科リスク工学専攻
  • 宮本 定明
    筑波大学大学院システム情報工学研究科リスク工学専攻
  • 長谷川 康
    筑波大学大学院システム情報工学研究科リスク工学専攻

書誌事項

タイトル別名
  • On Hard Clustering for Data with Tolerance
  • キョヨウ ハンイツキ データ ニ タイスル ハード クラスタリング

この論文をさがす

抄録

本稿では,データに伴う不確実性を,許容範囲という新たな概念を導入して,定式化した上で,許容範囲を持つデータに対する2つの新たなクラスタリングアルゴリズムを,代表的なクラスタリング手法であるハード c-平均法(HCM)と学習ベクトル量子化によるクラスタリング手法(LVQC)それぞれをもとにして構築する.許容範囲とは,データが持つ誤差・幅・属性の欠損などを包含したデータに伴う不確実性を表す概念である.従来のクラスタリング手法では,その対象がパターン空間上にマッピングされた点であるが,データがある種の不確実性を含む場合,データは点ではなく,集合として表される.既に提案されている手法では,集合間の類似度や非類似度は最短距離や最長距離などの測度を用いて定義される.しかし,それら別の測度を導入するよりは,それらを導入せずに同一の測度を用いて議論を展開するほうが自然であるし,論理的にも簡潔となる.そこで,不確実性を持つデータを最適化の枠組で扱うための新たな方法として,超直方体で定義された許容範囲を提案し,新たなアルゴリズムの構築を行う.また,提案手法による,いくつかの数値例を示し,その有効性を示す.

収録刊行物

  • 知能と情報

    知能と情報 20 (3), 388-398, 2008

    日本知能情報ファジィ学会

参考文献 (18)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ