AdaBoost と能動学習を用いたテキスト分類 Text Categorization using Active Learning with AdaBoost

この論文をさがす

著者

抄録

本稿では、テキスト分類のタスクに対し、AdaBoostを用いた能動学習の手法を適用した結果を報告する。対象文書としてReutesr-21578コレクションを用いたところ、能動学習なしのAdaBoostの精度を、約1/10の正解データ量で実現できた。また、文書の表現を語の出現回数を特徴値とするベクトルから、語が出現したかどうかのbinary値を特徴値とするベクトルに変えるとにより、能動学習で観察されることのあるサンプル数の増加に伴う精度の劣化について考察した。

In this paper, we describe an active learning method with AdaBoost on a text categorization task. This method reduces by as much as one tenth the amount of labeled data needed by AdaBoost without the active learning method for Reuters 21578 newswire articles. We also discuss phenomena that the accuracy of the categorization decreases when the size of training data increases by changing the value of feature vectors from continuous to binary.

収録刊行物

  • 情報処理学会研究報告. NL,自然言語処理研究会報告

    情報処理学会研究報告. NL,自然言語処理研究会報告 146, 81-88, 2001-11-20

    一般社団法人情報処理学会

参考文献:  17件中 1-17件 を表示

被引用文献:  2件中 1-2件 を表示

各種コード

  • NII論文ID(NAID)
    110002935342
  • NII書誌ID(NCID)
    AN10115061
  • 本文言語コード
    JPN
  • 資料種別
    ART
  • ISSN
    09196072
  • NDL 記事登録ID
    6008317
  • NDL 雑誌分類
    ZM13(科学技術--科学技術一般--データ処理・計算機)
  • NDL 請求記号
    Z14-1121
  • データ提供元
    CJP書誌  CJP引用  NDL  NII-ELS 
ページトップへ