ウェブ閲覧における効率的なキーワード抽出とその利用 Efficient Keyword Extraction and Its Applications to Web Browsing

この論文にアクセスする

この論文をさがす

抄録

インターネットからの効率的な情報収集においてウェブブラウザの果たす役割は大きい.しかし,膨大な文書の検索および閲覧はユーザにとっていまだ大きな負担である.本論文では,情報収集の補助を目的として,ユーザが閲覧するウェブページからのキーワード抽出という問題について考察する.ここでのキーワードとは,任意の単語の連結(単語Nグラム)である.このため,接尾辞木をもとにした,任意の単語Nグラムを線形領域で表すデータ構造である単語Nグラム木を提案し,これを利用した高速な抽出アルゴリズムを与える.また,抽出されたキーワードを利用することで,得られたキーワードの表示,関連するウェブサイトの表示,検索語の入力候補の提示といった,ユーザのウェブ閲覧を補助するインタフェースを実現する手法を示す.Web browsers play an important role in information-gathering on the Internet. However, searching and browsing documents are still time-consuming jobs for many users. In this paper we present an algorithm for keyword extraction at the current Web page. The proposed algorithm utilizes a data structure, called word N-gram tree, which represents the all concatenations of words at most N in an inputed text. We also present browsing user interfaces based on the extraction, for showing related sites, for finding summary paragraph, and for suggesting input queries for Web search.

収録刊行物

  • 情報処理学会論文誌データベース(TOD)

    情報処理学会論文誌データベース(TOD) 1(1), 49-60, 2008-06-26

    情報処理学会

各種コード

  • NII論文ID(NAID)
    110007990001
  • NII書誌ID(NCID)
    AA11464847
  • 本文言語コード
    JPN
  • 資料種別
    Article
  • ISSN
    1882-7799
  • NDL 記事登録ID
    024346672
  • NDL 請求記号
    YH247-812
  • データ提供元
    NDL  NII-ELS  IPSJ 
ページトップへ