ブログ記事と Web ページを用いたイベント情報抽出手法の提案 An Extraction Method of Event Names using Blog and Web Pages

この論文にアクセスする

この論文をさがす

著者

抄録

ブログ記事と Web ページを利用したイベント情報抽出手法を提案する.提案手法は,ブログ記事からイベント名抽出パターンを構築し, Web ページからイベント名を抽出する.本研究では,ブログ記事と Web ページを利用したイベント情報抽出手法を提案する.ブログ記事を用いることにより,記事の書かれた日付が分かり,イベント名抽出パターンとイベント開催日の関係を把握できる.Web ページを用いることにより,イベント名検索の網羅性を広げることができる.提案手法では,まず,いくつかのイベント名に対してブログ記事を収集し,そこからイベント名の前後に連接しやすいパターンを抽出する.次に,抽出したパターンを用いて Web 全体からイベント名を収集する.提案手法のイベント名収集適合率と将来構想について報告する.An extraction method of event names appeared on the Web using blog and Web articles is described. Proposed method extracts event names from Web pages by finding extraction patterns of event names from blog articles. The method finds extraction patterns from blog articles that contain event names given by a user. Because different names for the same event can be appeared on the Web, the method identifies the same event using a string kernel that can measure similarities of event names. Then, the method finds event names by using extracted patterns. Preliminary results of an experiment are described.

An extraction method of event names appeared on the Web using blog and Web articles is described. Proposed method extracts event names from Web pages by finding extraction patterns of event names from blog articles. The method finds extraction patterns from blog articles that contain event names given by a user. Because different names for the same event can be appeared on the Web, the method identifies the same event using a string kernel that can measure similarities of event names. Then, the method finds event names by using extracted patterns. Preliminary results of an experiment are described.

収録刊行物

  • 研究報告デジタルドキュメント(DD)

    研究報告デジタルドキュメント(DD) 2009(35(2009-DD-70)), 37-44, 2009-03-18

    一般社団法人情報処理学会

各種コード

  • NII論文ID(NAID)
    110007333940
  • NII書誌ID(NCID)
    AN10539261
  • 本文言語コード
    JPN
  • 資料種別
    Technical Report
  • データ提供元
    NII-ELS  IPSJ 
ページトップへ