文節重要度と係り受け整合度に基づく日本語文簡約アルゴリズム A Japanese Sentence Compaction Algorithm Based on Phrase Significance and Inter-Phrase Dependency

この論文にアクセスする

この論文をさがす

著者

    • 小黒 玲 OGURO REI
    • 電気通信大学 電気通信学研究科 Graduate School of Electro-Communications, The University of Electro-Communications
    • 尾関 和彦 OZEKI KAZUHIKO
    • 電気通信大学 電気通信学研究科 Graduate School of Electro-Communications, The University of Electro-Communications
    • 高木 一幸 TAKAGI KAZUYUKI
    • 電気通信大学 電気通信学研究科 Graduate School of Electro-Communications, The University of Electro-Communications

抄録

これまで主に検討されてきた文書要約手法は, 文集合から重要文を抽出するものである. この方法によれば, 段落などを要約した結果として誤りのない文の集合が得られる. しかし, 目的によっては更に要約率を上げるため, または段落などの単位での要約が不適当であるときなど, 一文毎の簡約が必要となる場合がある. このような文書要約手法では, 簡約文が日本語として自然な文であることが重要ppである. そこで本論文では, 文の簡約を「原文から, 文節重要度と文節間係り受け整合度の総和が最大になる部分文節列を選択する」問題として定式化し, それを解くための効率の良いアルゴリズムを提案する. 本稿の定式化では簡約文の評価に文節問の係り受け整合度が用いられていることから, 簡約結果は適切な係り受け構造を持つことが期待できる. したがって本手法を用いることにより, 自然で正確な簡約文を高速に生成できる可能性がある. このアルゴリズムを実用するには, 文節重要度と係り受け整合度の適切な設定が不可欠であるが, 本稿ではこれらについては議論せず, アルゴリズムの導出と計算効率, 実装法などに重点を置いて報告する.

Conventional methods for text summarization are mostly based on the idea of selecting important sentences from a set of given sentences such as a paragraph or a whole text. Those methods have a merit that each selected sentence remains unchanged and is thus correct. However, it is sometimes necessary to shorten each sentence, when a higher compaction rate is required, or when a paragraph-by-paragraph summarization is not adequate. In such sentence compaction, it is important that a shortened sentence is natural as a Japanese sentence. In this paper, the sentence compaction problem is formulated as "a problem of selecting a subsequence of phrases from a given sentence that maximizes the sum of phrase significance scores and inter-phrase dependency scores." Then, an efficient algorithm to solve this problem is proposed. Since this method takes inter-phrase dependency into account, a shortened sentence is expected to be grammatically correct and natural. This paper is focused on the derivation, computational complexity, and implementation issues of the algorithm, and will not discuss the matter of how to define the phrase significance score and the inter-phrase dependency score, though it will be a crucially important matter in practical applications.

収録刊行物

  • 自然言語処理 = Journal of natural language processing  

    自然言語処理 = Journal of natural language processing 8(3), 3-18, 2001-07-10 

    一般社団法人 言語処理学会

参考文献:  10件

参考文献を見るにはログインが必要です。ユーザIDをお持ちでない方は新規登録してください。

被引用文献:  3件

被引用文献を見るにはログインが必要です。ユーザIDをお持ちでない方は新規登録してください。

各種コード

  • NII論文ID(NAID)
    10021991423
  • NII書誌ID(NCID)
    AN10472659
  • 本文言語コード
    JPN
  • 資料種別
    ART
  • ISSN
    13407619
  • NDL 記事登録ID
    5840969
  • NDL 雑誌分類
    ZU8(書誌・図書館・一般年鑑--図書館・ドキュメンテーション・文書館)
  • NDL 請求記号
    Z21-B168
  • データ提供元
    CJP書誌  CJP引用  NDL  J-STAGE 
ページトップへ