係り受け関係を用いた重複表現削除 Reduction of overlapping expressions using dependency relations

この論文にアクセスする

この論文をさがす

著者

抄録

字幕生成のためのニュース文要約のような報知的要約では, 原文の情報を落とさないことが望まれる. 本論文では, このような原文の情報を極力落とさない要約手法の一っとして, 重複部削除による要約手法について議論する. テキスト内に, 同一の事象を表す部分が再度出現したならば, その部分を削除することによって冗長度を減少させ, 情報欠落を可能な限り回避した要約を行う. 事象の重複を認定するために, 係り受け関係のある2語が一つの事象を表していると仮定し, 2語の係り受け関係の重複を事象の重複と認定する. また, 2語の係り受け関係を用いて重複部を削除するだけでは, 読みやすく, かつ, 自然な要約文を生成することができない. そのために考慮すべきいくつかの情報について議論する. 以上の方法のうち, 実装可能な部分を計算機上に実装し, 評価実験を行った. 人間による削除箇所と本手法による削除箇所とを比較したところ, 再現率81.0%, 適合率85.1%の結果を得た.

Informative summaries are used as substitutions for original texts.It is necessary for those for captions of newscasting, in particular, to keep the original information as much as possible. This paper discusses a summarization method of reducing overlaps to generate informative summaries. Deleting a part of the text which refers to the same content as some other part can reduce redundancy and avoid lack of information. In order to recognize overlaps, we utilize a pair of dependent words. Deletion of overlaps only using a pair of words having a dependency sometimes makes a summary unnatural and difficult to read. Therefore, what should be considered to cope with the problems is described. We compared summaries of TV news texts independently generated by our method and by human for evaluation. The experimental results show that the precision attained 85.1% and the recall attained 81.0%, respectively.

収録刊行物

  • 自然言語処理 = Journal of natural language processing

    自然言語処理 = Journal of natural language processing 7(4), 119-142, 2000-10-10

    一般社団法人 言語処理学会

参考文献:  14件中 1-14件 を表示

各種コード

  • NII論文ID(NAID)
    10008829958
  • NII書誌ID(NCID)
    AN10472659
  • 本文言語コード
    JPN
  • 資料種別
    ART
  • ISSN
    13407619
  • NDL 記事登録ID
    5544250
  • NDL 雑誌分類
    ZU8(書誌・図書館・一般年鑑--図書館・ドキュメンテーション・文書館)
  • NDL 請求記号
    Z21-B168
  • データ提供元
    CJP書誌  NDL  J-STAGE 
ページトップへ