不均衡データに対する多段階学習を用いたアンサンブルモデルによる2クラス分類アルゴリズムの提案

書誌事項

タイトル別名
  • A New Ensemble Model for Imbalanced Two-class Classification by Learning Multistage

この論文をさがす

抄録

近年,機械学習を用いた2クラス分類アルゴリズムは,種々のアプリケーション実現のための中核的な技術要素として応用されている.一方で,応用される多くの事例では対象データが少数の陽性と多数の陰性から構成される不均衡データであり,この不均衡性によって陽性の分類精度が低くなってしまうことが問題になっている.本稿では,不均衡データに対する陽性の分類精度の向上を目的とした2クラス分類アルゴリズムについて研究する.一般的に,不均衡データに対する陽性の分類精度を向上させようとした場合,偽陰性の減少と引き換えに偽陽性が増加する可能性がある.そこで本研究では,不均衡データに対して偽陰性・偽陽性をともに減少させる多段階学習を用いたアンサンブルモデルによる2クラス分類アルゴリズムを提案する.提案手法では,分類が難しいと判断されたデータに対して学習を繰り返し,期ごとに複数のモデルを作成する.多段階的に作成された複数のモデルを用いて,偽陰性を減少させるための最適線形結合モデルと偽陽性を減少させるためのカスケード結合モデルをそれぞれ構築し,この2つのモデルを統合して最終的な分類を行う.実験を通じて,提案手法を用いることによって,既存手法よりも陽性の分類精度が向上すること,偽陰性と偽陽性がともに減少することを示した.

In recent years, algorithms for classification with two possible outcomes have played important roles in machine learning. In various applications in the real world, the analyzing datasets are hard to deal with because the sizes of classes are imbalanced, i.e., the data contain a few positive outcomes while contain many negative outcomes. This imbalance causes the low accuracy of classification for positive. Many algorithms for two-class classification have been developed to improve the accuracy of classification even if the dataset is imbalanced. However, such algorithms tend to yield increasing false positives in return for reducing false negatives. We propose an algorithm tries to reduce both false negative and false positives in multistage learning. By using several learning machines, our algorithm constructs several models. To reduce false negatives, we take an optimal linear combination of those models. On the other hand, to reduce false positives, we take a cascade classifier. Integrating these two models, the solution for classification is given. Computational experiments are performed to verify the proposed method and to ascertain that the classification accuracy of positive is better than the existing method. The proposed method succeeded to decrease both the false negative and false positives.

収録刊行物

関連プロジェクト

もっと見る

詳細情報 詳細情報について

  • CRID
    1050845764115783296
  • NII論文ID
    170000181260
  • NII書誌ID
    AA11464803
  • ISSN
    18827780
  • Web Site
    http://id.nii.ac.jp/1001/00201495/
  • 本文言語コード
    ja
  • 資料種別
    article
  • データソース種別
    • IRDB
    • CiNii Articles
    • KAKEN

問題の指摘

ページトップへ