TF2P-growth:閾値設定を必要としない頻出アイテムセット抽出アルゴリズム

書誌事項

タイトル別名
  • TF2P growth イキチ セッテイ オ ヒツヨウ ト シナイ ヒンシュツ アイテムセット チュウシュツ アルゴリズム
  • TF2P-growth:Frequent Itemset Mining Algorithm without Any Thresholds

この論文をさがす

抄録

データマイニング分野での頻出アイテムセット抽出手法は,最小サポート値を与えて,最小サポート値以上のサポート値を持つアイテムセットを抽出する手法である.与えられる最小サポート値から抽出される頻出アイテムセット数を予測することは困難であることから,最小サポート値を必要とせ0ず,頻出上位数k を指定して,サポート値降順にk アイテムセットを抽出するTop-k Mining コンセプトが近年提案されている.しかし,Top-k Mining コンセプトも閾値としてk を指定する必要があり,ユーザはマイニングプロセス開始時に,解析に必要なアイテムセット数を予測しなければならない.本稿では,最小サポート値や閾値をユーザが指定する必要のない頻出アイテムセット抽出法としてTF2P-growth アルゴリズムを提案する.TF2P-growth は,短時間でサポート値降順にアイテムセットを抽出しユーザに返すアルゴリズムである.

Conventional frequent itemset mining algorithms require some user-specified minimum support, and then mine frequent itemsets with support values that are higher than the minimum support. As it is difficult to predict how many frequent itemsets will be mined with a specified minimum support, the Top-k mining concept has been proposed. The Top-k Mining concept is based on an algorithm for mining frequent itemsets without a minimum support, but with the number of most k frequent itemsets ordered according to their support values. However, the Top-k mining concept still requires a threshold k. Therefore, users must decide the value of k before initiating mining. In this paper, we propose a new mining algorithm, called “TF2P-growth,” which does not require any thresholds. This algorithm mines itemsets with the descending order of their support values without any thresholds and returns frequent itemsets to users sequentially with short response time.

収録刊行物

参考文献 (18)*注記

もっと見る

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ