Regression Analysis Using Lasso-Random Forest

DOI

Bibliographic Information

Other Title
  • Lasso 調整型確率化平衡樹木による回帰解析

Abstract

<p>回帰解析の場面では,目的変数と説明変数の間にある(確率) モデルを想定し,そのモデルに則した形で観測データに対する統計的解釈を付与することが一般的である.しかし目的変数が1 個,説明変数が複数個ある場面において,パラメータに関する線形性(加法性) を想定した線形回帰モデルでは現実の現象を捉えたモデルを構築することは困難である.一つの対処法は,モデル内に非線形構造および交互作用構造を含めることができる樹木構造接近法を用いることである.樹木構造接近法は,Breiman et al.(1984) による分類回帰樹木(CART:Classi cation and RegressionTrees) 法の提案以降,様々な手法が統計科学あるいはデータ・マイニングの分野で提案されている.近年では,樹木構造接近法の低い予測確度の問題を回避するための方法,すなわちアンサンブル学習法が注目されている.アンサンブル学習法とは,樹木モデル(弱学習器) を統合することで,高い予測確度をもつことができる方法である.その代表的な手法の一つが確率化平衡樹木(RF:RandomForest:Breiman, 2001) 法である.このとき,樹木の構築過程に縮小推定量を加味することで,より良好な推定量を得られることがFriedman & Popescu(2004) により指摘されている.本発表では,RF 法に縮小推定量のひとつであるLasso(Tibshirani,1996) を加味させたLasso 調整型確率化平衡樹木(Lasso-RF) 法を提案する.</p>

Journal

Details 詳細情報について

Report a problem

Back to top