多属性項目の履歴情報に基づく電子メイル文書のフィルタリング手法

書誌事項

タイトル別名
  • タゾクセイ コウモク ノ リレキ ジョウホウ ニ モトヅク デンシ メイル ブンショ ノ フィルタリング シュホウ
  • A Filtering Method for E-mail Documents Using Personal Profiles
  • 自然言語処理

この論文をさがす

抄録

近年,インターネットの普及にともない,大量のメイル文書が氾濫し,各メイル文書の重要度を自動的に判定するフィルタリング処理の実現が望まれている.従来のフィルタリング技術は,出現単語といった単一属性を扱ったものが多く,十分な精度が得られなかった.本論文では,受信済みのメイル文書から送信元,テーマや類型等の多属性項目の組合せから成る構造化知識を獲得し,その知識を用いたフィルタリング手法を提案する.さらに,各属性の意味に従って近似処理を適用すべき属性の順番を定義し,学習データ数が少ない場合にも,ノイズの混入を極力抑えて正確な重要度を算出する.4人の被験者に対する実験結果から,単語の出現頻度という単一属性のみで判定した重要度よりも,多属性値の組合せを考慮した重要度の方が人手で判定した結果と高い相関を示すことが確認できた.

Nowadays, E-mail is very often used as the one of communication methods, however a lot of E-mail documents including useless information such as commercial mails is distributed to our computers. In order to solve this problem, we propose a method to filter out unimportant E-mail documents automatically by judging the content of each document. This method extracts the corpus-based knowledge from existing E-mail documents which have been already received by each user. This knowledge consists of multi-attribute items such as the sender, theme and type of each existing document. By using the acquired knowledge, this method can show whether a new E-mail document is important or not for the user. From the experimental results, it is found that this method can calculate more accurate point than traditional methods, which use sole attribute based on the statistics of word occurrences.

収録刊行物

被引用文献 (1)*注記

もっと見る

参考文献 (12)*注記

もっと見る

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ