この論文を読む/探す
抄録
本論文では,テキスト区画(とくに英語の物語における場面)の境界を推定するための統計的な指標として,LCP(lexical cohesion profile)を提案する.テキスト区画は,意味的に一貫した部分テキストであり,そこに現われる単語がたがいに結束性(lexical cohesion)によって結ばれる傾向をもつ.LCPは,テキスト上を移動する一定幅の窓から見える単語列の結束度を記録したものである.単語列の結束度は,英語辞書から規則的に構成された意味ネットワーク上の活性伝播によって計算される.人間の直感による場面分割と比較した結果,LCPの変化が場面境界とつよい相関をもつことが確かめられた.LCPによって推定される場面境界は,照応や省略を解決するための手がかりとして利用できる.
This paper proposes a new indicator of text segment, called LCP (lexical cohesion profile), based on lexical cohesion between words. A text segment is a coherent scene in which the words tend to have lexical cohesion with each other. LCP is a record of cohesiveness of words in an interval moving on the text. The cohesiveness is computed by spreading activation on a semantic network constructed systematically from an English dictionary. Comparison with the segment boundaries marked by a number of subjects shows that LCP closely correlates with the human intuition. LCP provides valuable information for resolving anaphora and ellipsis.