トランスダクティブ・ブースティング法によるテキスト分類 Text Categorization Using a Transductive Boosting Method

この論文にアクセスする

この論文をさがす

著者

抄録

本論文では,トランスダクティブ・ブースティング法によるテキスト分類手法を提案する.テキスト分類器の学習に使用する大規模な訓練データの作成にはコストや時間がかかる.そのため訓練データが少ない場合にも高い分類精度が得られる学習法が求められている.トランスダクティブ法は学習の際に訓練データだけでなく,分類クラスの付与されていないテストデータの分布も考慮に入れることにより分類精度を上げる方法である.本論文ではこれをブースティングに対し適用し,実験を行った.その結果,従来のブースティングによる学習に比べて高精度のテキスト分類器を学習できた.特に少数の訓練データしかない場合にも高い精度が得られた.This paper describes a new text categorization method using transductiveboosting. It is time-consuming and expensive to assemble a large corpus of categorized textfor use with learning-based classification methods.Therefore, we require learning methods that are able to learn classifiersextremely accurately from a small quantity of training data.The transductive method takes account of bothtraining data and test data distribution and provides a highly accurate classifier.We adopt a transductive method in a boosting algorithm for text categorization. The categorization performance was better than that of the original boosting.Specifically the performance wasimproved significantly for small quantities of training data.

This paper describes a new text categorization method using transductive boosting. It is time-consuming and expensive to assemble a large corpus of categorized text for use with learning-based classification methods. Therefore, we require learning methods that are able to learn classifiers extremely accurately from a small quantity of training data. The transductive method takes account of both training data and test data distribution and provides a highly accurate classifier. We adopt a transductive method in a boosting algorithm for text categorization. The categorization performance was better than that of the original boosting. Specifically the performance was improved significantly for small quantities of training data.

収録刊行物

  • 情報処理学会論文誌

    情報処理学会論文誌 43(6), 1843-1851, 2002-06-15

    一般社団法人情報処理学会

参考文献:  24件中 1-24件 を表示

被引用文献:  5件中 1-5件 を表示

各種コード

  • NII論文ID(NAID)
    110002726409
  • NII書誌ID(NCID)
    AN00116647
  • 本文言語コード
    JPN
  • 資料種別
    Journal Article
  • ISSN
    1882-7764
  • NDL 記事登録ID
    6189379
  • NDL 雑誌分類
    ZM13(科学技術--科学技術一般--データ処理・計算機)
  • NDL 請求記号
    Z14-741
  • データ提供元
    CJP書誌  CJP引用  NDL  NII-ELS  IPSJ 
ページトップへ