ディリクレ過程混合モデルに基づく離散データの共クラスタリング

桑田, 修平, 山田, 武士, 上田, 修功

書誌事項

タイトル別名

ディリクレカテイコンゴウモデルニモトズクリサンデータノキョウクラスタリング
Co-clustering Discrete Data Based on the Dirichlet Process Mixture Model

この論文をさがす

抄録

ディリクレ過程混合モデルを用いた共クラスタリング手法を提案する．共クラスタリングとは，ユーザのアイテム購入履歴などのような行列形式で表現可能なデータに対して，行（ユーザ）と列（アイテム）を同時にクラスタリングする問題である．提案法は，ユーザ（もしくはアイテム）クラスごとにアイテム（もしくはユーザ）クラス数次元の多項分布を仮定し，互いに同じクラスを選択しあったときに購入行動が生じると仮定したモデルに基づいて共クラスタリングする．提案法は，ユーザ（アイテム）クラス数を事前に設定することなく共クラスタリングができ，特に，購買履歴のような欠損値を含むデータに対してより良いクラスタリング精度を示す．実データを用いた実験により，ディリクレ過程混合モデルに基づく従来手法（無限関係モデル）と比べて，より精度の高い共クラスタリング結果が得られることを示す．

We propose a new co-clustering method based on the Dirichlet process mixture model (DPM). Co-clustering is the problem of simultaneously clustering rows and columns of a data matrix, such as purchase history data of users and catalog items. The proposed method assumes that each user (or item) class has a multinomial distribution over item (or user) classes to select, and a purchase occurs when both selections of user and item classes match. The proposed method can co-cluster users and items without knowing the true numbers of clusters. The experimental results show that the proposed method can provide better co-clustering results compared with Infinite Relational Model (IRM), another previously proposed co-clustering method based on the DPM, especially for data matrices that contain missing data.

収録刊行物

情報処理学会論文誌数理モデル化と応用（TOM）

情報処理学会論文誌数理モデル化と応用（TOM） 1 (1), 60-73, 2008-09-26

東京 : 情報処理学会

詳細情報詳細情報について

CRID: 1050845762821851136

NII論文ID: 110007970996

NII書誌ID: AA11464803

ISSN: 18827780; 18827772; 03875806

NDL書誌ID: 024345326

Web Site: http://id.nii.ac.jp/1001/00017054/; http://id.ndl.go.jp/bib/024345326; https://ndlsearch.ndl.go.jp/books/R000000004-I024345326

本文言語コード: ja

資料種別: article

データソース種別

IRDB
NDL
CiNii Articles

ディリクレ過程混合モデルに基づく離散データの共クラスタリング

書誌事項

この論文をさがす

抄録

収録刊行物

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

ディリクレ過程混合モデルに基づく離散データの共クラスタリング

書誌事項

この論文をさがす

抄録

収録刊行物

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

参加プロジェクトリスト

詳細情報詳細情報について