ディリクレ過程混合モデルに基づく離散データの共クラスタリング

書誌事項

タイトル別名
  • ディリクレ カテイ コンゴウ モデル ニ モトズク リサン データ ノ キョウ クラスタリング
  • Co-clustering Discrete Data Based on the Dirichlet Process Mixture Model

この論文をさがす

抄録

ディリクレ過程混合モデルを用いた共クラスタリング手法を提案する.共クラスタリングとは,ユーザのアイテム購入履歴などのような行列形式で表現可能なデータに対して,行(ユーザ)と列(アイテム)を同時にクラスタリングする問題である.提案法は,ユーザ(もしくはアイテム)クラスごとにアイテム(もしくはユーザ)クラス数次元の多項分布を仮定し,互いに同じクラスを選択しあったときに購入行動が生じると仮定したモデルに基づいて共クラスタリングする.提案法は,ユーザ(アイテム)クラス数を事前に設定することなく共クラスタリングができ,特に,購買履歴のような欠損値を含むデータに対してより良いクラスタリング精度を示す.実データを用いた実験により,ディリクレ過程混合モデルに基づく従来手法(無限関係モデル)と比べて,より精度の高い共クラスタリング結果が得られることを示す.

We propose a new co-clustering method based on the Dirichlet process mixture model (DPM). Co-clustering is the problem of simultaneously clustering rows and columns of a data matrix, such as purchase history data of users and catalog items. The proposed method assumes that each user (or item) class has a multinomial distribution over item (or user) classes to select, and a purchase occurs when both selections of user and item classes match. The proposed method can co-cluster users and items without knowing the true numbers of clusters. The experimental results show that the proposed method can provide better co-clustering results compared with Infinite Relational Model (IRM), another previously proposed co-clustering method based on the DPM, especially for data matrices that contain missing data.

収録刊行物

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ