自動要約のための文重要度の比較  [in Japanese] Empirical Comparison of Sentence Importance Measures for Automatic Text Summarization  [in Japanese]

Access this Article

Search this Article

Author(s)

Abstract

本稿では, 重要文抽出によるテキスト自動要約のための各種重要度を比較した. 特に, タイトルとの類似度の高い文から抽出するという要約方法を想定し, 各種の類似度を比較した. 類似度としては, 共起関係を利用する方法と利用しない方法とを試みた. その結果, 共起関係を利用する方法の方が高精度な要約が作成できた. また, 要約の手法としては, 他に, 本文の先頭数文を抽出する方法と, 単語の重要度の総和を文の重要度とする方法も試みたが, これらの方法よりも, タイトルとの類似度に基づく方法の方が高精度であった. これらの結果は, 共起関係を利用した類似度が自動要約に有効であることを示している.

The effectiveness of various statistical measures of sentence importance was compared for automatic text summarization done by extracting important sentences. We focused on comparing various measures of sentence similarity on the assumption that important sentences in an article are similar to the title. Two types of similarity measures were compared: one uses word co-occurrence statistics and the other does not. The former proved superior to the latter. Other automatic text summarization methods, such as extracting the leading part of an article, or extracting sentences with important words, proved inferior to the similarity-based method. These results show that similarity measurement using word co-occurrence statistics is effective for automatic text summarization.

Journal

  • Journal of Natural Language Processing

    Journal of Natural Language Processing 7(4), 261-270, 2000-10-10

    The Association for Natural Language Processing

References:  8

Cited by:  1

Codes

  • NII Article ID (NAID)
    10008830071
  • NII NACSIS-CAT ID (NCID)
    AN10472659
  • Text Lang
    JPN
  • Article Type
    Journal Article
  • ISSN
    13407619
  • NDL Article ID
    5544342
  • NDL Source Classification
    ZU8(書誌・図書館・一般年鑑--図書館・ドキュメンテーション・文書館)
  • NDL Call No.
    Z21-B168
  • Data Source
    CJP  CJPref  NDL  J-STAGE 
Page Top