テキストの自動分類に関わる諸要素

書誌事項

タイトル別名
  • Elements of Automated Text Categorization
  • テキスト ノ ジドウ ブンルイ ニ カカワル ショ ヨウソ

この論文をさがす

抄録

テキストの分類は, 既存のカテゴリにテキストを割り当てることであり, 様々な手続きを必要とする。本論文では, テキストの自動分類研究を再検討し将来の方向性について述べた。自動分類を構成する要素は, テキスト構造, データ量, 特徴素単位の定義, 特徴素集合の決定, カテゴリ表現, テキスト表現, 類似度計算, 分類先決定方法, 評価である。各要素や要素間の関係について, 既往研究から明らかにした。例えば, テキスト構造と特徴素集合の決定は自動分類全体に大きな影響を与えること, カテゴリ表現と類似度計算は相互に深く関わっていること, 特徴素単位の定義は外的要因の影響を受けるが, その定義は自動分類全体に大きな影響を与えることなどが明らかになった。将来の方向性として, Webページを対象にした自動分類を想定した。テキスト構造と特徴素集合の決定には新たな問題が生じ, テキスト構造は以前に比べてより重要な要素となることを予想した。

収録刊行物

被引用文献 (1)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ