入れ子依存木の刈り込みによる単一文書要約手法

DOI Web Site Web Site 参考文献15件 オープンアクセス

書誌事項

タイトル別名
  • Summarizing a Document by Trimming a Nested Tree Structure
  • イレコ イソン ボク ノ カリコミ ニ ヨル タンイツ ブンショ ヨウヤク シュホウ

この論文をさがす

抄録

近年の抽出型要約の多くの手法は,原文書の情報を網羅し,かつ与えられる要約長の制約に柔軟に対応すべく,文抽出と文圧縮を併用した組み合わせ最適化問題として要約を定式化している.つまり,文書から文という文法的な単位を維持するよう単語を抽出することで要約を生成している.従来の手法は非文の生成を避けるため,構文木における単語間の関係を利用して文を圧縮しているものの,文書における大域的な文と文の間の関係,つまり談話構造には着目してこなかった.しかし,談話構造を考慮することは要約の一貫性を保つ上で非常に重要であり,文書の重要箇所の同定にも役立つ.我々は,文書を文間の依存関係,単語間の依存関係をあらわした入れ子依存木とみなし,単語重要度の和が最大となるように木を刈り込むことで要約を生成する手法を提案する.実験の結果,提案手法が要約精度を有意に向上させたことが確認できた.

収録刊行物

  • 自然言語処理

    自然言語処理 22 (3), 197-217, 2015

    一般社団法人 言語処理学会

参考文献 (15)*注記

もっと見る

関連プロジェクト

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ