文書構造の認識と言語の特徴の利用に基づく電子メールからのスケジュールとToDoの抽出

書誌事項

タイトル別名
  • テキスト処理 文書構造の認識と言語の特徴の利用に基づく電子メールからのスケジュールとToDoの抽出
  • テキスト ショリ ブンショ コウゾウ ノ ニンシキ ト ゲンゴ ノ トクチョウ ノ リヨウ ニ モトヅク デンシ メール カラ ノ スケジュール ト ToDo ノ チュウシュツ
  • Extraction of Schedules and To - Do Items from E - mail Messages by Identifying Message Structures and Using Language Expressions
  • テキスト処理

この論文をさがす

抄録

インターネットの普及にともない,電子メールはコミュニケーションの主要な手段となった.一方,Personal Information Manager (PIM)ソフトウェアの普及にともない,個人情報を計算機で管理するユーザが増えている.ユーザの個人情報として,アポイントメントの日時や場所等のスケジュールや,期限をともなう電子メールの返信等のToDoがあげられる.しかしながら,電子メールにより伝達されるスケジュールやToDoに関する情報の管理は,これらの情報を含む文書の整理やPIMソフトウェアとの連携の際に,電子メールを受信するユーザの人手を必要としていた.本稿では,ユーザが受信した電子メール文書からユーザに伝達されるスケジュールとToDoの情報を抽出する手法を提案する.電子メール文書は,任意の目的への使用と自由な形式による情報伝達のため,文書構造や言語表現が一様ではない.本手法の特徴は,スケジュールやToDoを含む電子メール文書の構造と言語の特徴に着目したレイアウト情報とパターンマッチングを用いた,文書構造の認識と情報抽出および情報の関連付けである.電子メールの実文書を対象とした抽出実験により,電子メールのフィルタリングやPIMソフトウェアへの入力等の実用に耐えうる高い精度で,スケジュールとToDoを抽出できることを示す.

As the Internet has become popular,e-mail is now an important means of communication.On the other hand,as the Personal Information Managers (PIM) applications have come into wide use recently,many users manage their schedules,such as event date and event location,and to-do items,such as answers to e-mail messages from someone by the appointed time,with their computers.However,a problem is that e-mail receivers cannot easily sort out messages with these information from many incoming messages and build up a close connection with the receivers'PIMs.Therefore,our goal is extracting these information from the e-mail messages users receive.E-mail is open to any purpose and any format.So these information is not formalized,and message structure and language expression are not uniform.We reveal the characteristics of the structure and language used in e-mail messages and propose a way to identify the structure and extract information by using layout information and pattern matching and relate matched partial information with components of these information.Extraction evaluations demonstrate high recall and precision.Our proposal can be put to practical use,such as filtering messages and inputting the information to PIMs.

収録刊行物

被引用文献 (6)*注記

もっと見る

参考文献 (13)*注記

もっと見る

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ