区間・領域分割を用いた Regression Tree の構成 Efficient Construction of Regression Trees with Range and Region Splitting

この論文をさがす

著者

抄録

近年データマイニング(data mining)がデータベース研究と人工知能研究の境界分野として注目を集めているが、そのなかの一トピックとしてデータベースからのregression tree構成がある。従来のregression tree構成においては内部ノードを分割する際そのノードに対応するデータセットをある単一属性の値がある定数値より小さいか否かで振り分ける手法(guillotine-cut)がとられてきたが、我々はそれに代わるものとして、データセットを2つの数値属性が張る平面中のある領域に含まれるか否かで振り分ける手法をその効率的な実現法とともに提案し、あわせて実装およぴ実験を行った。

In recent years data mining has attracted many researchers among both artificial intelligence and database communities. Construction of regression trees is a topic of data mining. A regression tree is a rooted binary tree such that each internal node contains a test for splitting tuples into two disjoint classes. The mean of the objective attribute values at the leaf is used as the predicted value of the tuple. To test a numerical attribute, traditional methods use a guillotine-cut splitting that classifies data into those below a given value and others. In this paper, as an alternative of guillotine-cut splitting, we consider a family R of grid-regions in the plane associated with two given numeric attributes. And we propose to use a test that splits data into those that lie inside a region R and those that lie outside. Some experimental results showed that regression trees constructed through our method have higher accuracy than those through guillotine-cut splitting.

収録刊行物

  • 電子情報通信学会技術研究報告. AI, 人工知能と知識処理

    電子情報通信学会技術研究報告. AI, 人工知能と知識処理 97(415), 57-62, 1997-12-02

    一般社団法人電子情報通信学会

参考文献:  13件中 1-13件 を表示

被引用文献:  1件中 1-1件 を表示

各種コード

  • NII論文ID(NAID)
    110003186761
  • NII書誌ID(NCID)
    AN10013061
  • 本文言語コード
    JPN
  • 資料種別
    ART
  • データ提供元
    CJP書誌  CJP引用  NII-ELS 
ページトップへ