重要文抽出に基づく講義音声の自動要約

書誌事項

タイトル別名
  • Class Lecture Summarization Based on Important Sentence Extraction

この論文をさがす

抄録

本論文では,大学院における講義音声を対象とした,重要文抽出に基づく自動要約手法を述べる.本論文ではまず,音声要約においてよく使われているMaximal Marginal Relevance(MMR)と識別器にSupport Vector Machine(SVM)を用いたfeature-basedを比較し,feature-basedの方が優れた結果を与えることを示す.次に,feature-basedの改善手法に関して述べる.Feature-basedの改善のために,3つのアプローチを試みた.1つ目は,重要文中によく出現するような重要文の手がかり表現(Cue Phrase for important sentences; CP)を自動抽出し,自動要約の素性とする手法である.CPの抽出はConditional Random Fields(CRF)を用いてラベリング問題として定式化される.2つ目は,人間による要約は重要文が連続しやすいという観測に基づき,重要文の連続性を考慮した要約を行う方法である.連続性を考慮するために,連続性をとらえる新たな素性を使用する.3つ目は,冗長性を排除する枠組みの導入である.これらの3手法を用いることで,feature-basedによる要約を改善できた.

This paper describes summarization methods based on important sentence extraction for the summarization of class-room lecture. First, we compare two summarization techniques; a Maximal Marginal Relevance and a feature-based method which uses a Support Vector Machine (SVM) as a classifier. We show that the latter is superior to the former. Second, we improve the feature-based summarizer by three different types of approaches. In the first approach, we propose a technique that extracts “cue phrases for important sentences (CPs)” that often appear in important sentences and thus can be used as a feature to the summarizer. We formulate CP extraction as a labeling problem of word sequences and use Conditional Random Fields (CRF) for labeling. The second approach presents a novel sentence extraction framework that takes into account the consecutiveness of important sentences based on the observation that important sentences tend to be extracted consecutively by human. We deal with this consecutiveness by applying this new features to a feature-based summarizer. The third approach provides a way to reduce redundancy in the summary. Experimental result shows that our method outperforms traditional sentence extraction methods using these aproaches.

収録刊行物

被引用文献 (1)*注記

もっと見る

キーワード

詳細情報 詳細情報について

  • CRID
    1050564287852673024
  • NII論文ID
    110007970712
  • NII書誌ID
    AN00116647
  • ISSN
    18827764
  • Web Site
    http://id.nii.ac.jp/1001/00068731/
  • 本文言語コード
    ja
  • 資料種別
    journal article
  • データソース種別
    • IRDB
    • CiNii Articles

問題の指摘

ページトップへ