数値データからの直交凸領域結合ルール発見

書誌事項

タイトル別名
  • Finding Rectilinear Regions for Association Rules from Numeric Data

この論文をさがす

抄録

データマイニングにおいて2次元結合ルールや決定木作成に役に立つ領域切り出し問題を考える。我々は以前2次元数値属性をもつデータから最適X-単調領域を計算する効率のよいアルゴリズムを示した. ここでX-単調領域とはy軸に平行な線との交わりが必ず連続か空になる領域である。しかし、切り出された領域はy軸方向のノイズに過剰に反応し、トレーニングデータセットにオーバーフィットするため、将来のテストデータに対しての予測精度が低いという問題が残った。そこで本研究では切り出す領域に直交凸領域を使用することを提唱する。直交凸領域とはx軸と平行な線との交わりが必ず連続か空で、かつy軸との交わりも必ず連続か空になる領域である。直交凸領域を用いるとトレーニングデータセットへのオーバーフィットはあまり起こらず、切り出された領域は将来のテストデータへの良い予測を与えることを示す。またこの最適直交凸領域を実際に計算するアルゴリズムを示す。

収録刊行物

参考文献 (18)*注記

もっと見る

詳細情報 詳細情報について

  • CRID
    1574231876943124992
  • NII論文ID
    110002934042
  • NII書誌ID
    AN10114171
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ