単語の結束性にもとづいてテキストを場面に分割する試み Text Segmentation Based on Lexical Cohesion

    • 小嶋 秀樹 Kozima Hideki
    • 電気通信大学大学院情報工学専攻 Course in Computer Science and Information Mathematics, Graduate School, University of Electro-Communications
    • 古郡 延治 Furugori Teiji
    • 電気通信大学情報工学科 Department of Computer Science and Information Mathematics, University of Electro-Communications

抄録

本論文では,テキスト区画(とくに英語の物語における場面)の境界を推定するための統計的な指標として,LCP(lexical cohesion profile)を提案する.テキスト区画は,意味的に一貫した部分テキストであり,そこに現われる単語がたがいに結束性(lexical cohesion)によって結ばれる傾向をもつ.LCPは,テキスト上を移動する一定幅の窓から見える単語列の結束度を記録したものである.単語列の結束度は,英語辞書から規則的に構成された意味ネットワーク上の活性伝播によって計算される.人間の直感による場面分割と比較した結果,LCPの変化が場面境界とつよい相関をもつことが確かめられた.LCPによって推定される場面境界は,照応や省略を解決するための手がかりとして利用できる.

This paper proposes a new indicator of text segment, called LCP (lexical cohesion profile), based on lexical cohesion between words. A text segment is a coherent scene in which the words tend to have lexical cohesion with each other. LCP is a record of cohesiveness of words in an interval moving on the text. The cohesiveness is computed by spreading activation on a semantic network constructed systematically from an English dictionary. Comparison with the segment boundaries marked by a number of subjects shows that LCP closely correlates with the human intuition. LCP provides valuable information for resolving anaphora and ellipsis.

収録刊行物

情報処理学会研究報告. 自然言語処理研究会報告   [巻号一覧]

情報処理学会研究報告. 自然言語処理研究会報告 93(41), 49-56, 1993-05-20  [この号の目次]

一般社団法人情報処理学会

被引用文献:  6件

被引用文献を見るにはログインが必要です。ユーザIDをお持ちでない方は新規登録してください。

プレビュー

プレビュー

各種コード

  • NII論文ID(NAID) :
    110002930184
  • NII書誌ID(NCID) :
    AN10115061
  • 本文言語コード :
    JPN
  • 資料種別 :
    その他
  • 収録DB :
    CJP引用  NII-ELS