繰り返し構造の検出に基づくWebページの見出しの階層構造の解析 Analysis of Hierarchy of Headlines in Web pages Based on Detecting Repeated Structure

この論文にアクセスする

この論文をさがす

著者

抄録

文書中には類似した特徴を持つ見出しが反復的に現れる構造(繰り返し構造)がみられる.繰り返し構造を構成する見出し群は,文書の階層構造上では同一レベルに属すると考えられる.我々は先行研究において,Webページ中の繰り返し構造を検出することにより見出しの階層構造を解析する手法を提案しているが,本稿では繰り返し構造の検出手法を改善することにより,見出しの階層構造の解析精度の向上を試みる.また提案手法の効果を実験的に評価した結果を報告する.We have proposed a method to analyze a hierarchy of headlines in Web pages by detecting repeated structures. Our method can analyze the structure of Web pages that is not well structured. In this paper, we extend the method detecting repeated structures. In addition, we show an experimental evaluation of our method.

収録刊行物

  • 研究報告デジタルドキュメント(DD)

    研究報告デジタルドキュメント(DD) 2010-DD-75(6), 1-8, 2010-02-25

    情報処理学会

参考文献:  6件中 1-6件 を表示

各種コード

  • NII論文ID(NAID)
    110007991274
  • NII書誌ID(NCID)
    AN10539261
  • 本文言語コード
    JPN
  • 資料種別
    Technical Report
  • ISSN
    09196072
  • NDL 記事登録ID
    025095546
  • NDL 請求記号
    YH267-101
  • データ提供元
    CJP書誌  NDL  NII-ELS  IPSJ 
ページトップへ