Small World構造に基づく文書からのキーワード抽出

書誌事項

タイトル別名
  • Small World コウゾウ ニ モトヅク ブンショ カラ ノ キーワード チュウシュツ
  • Keyword Extraction Using Small World Structure in a Document
  • 自然言語処理

この論文をさがす

抄録

本論文では,Small World構造を利用した文書からのキーワード抽出法を提案する.Small Worldとは,ノードがクラスタ化されているにもかかわらず,ノード間の平均パス長が短いグラフ構造である.文書中の単語の共起関係により構成したグラフが,Small Worldの特徴を備えていることを示す.さらに,ある語を取り除くことによって平均パス長が大きく増加するような語をキーワードとして取り出す.このような語は,離れたクラスタ,すなわち概念を橋渡しする語であり,文書の主旨において重要な語である可能性が高い.

We develop a new keyword extraction algorithm which utilizes small world structure of a document.In a graph with small world structure,nodes are highly clustered yet the path length between them is small.A term co-occurrence graph,where nodes represent terms in a document and edges represent the co-occurrence of terms,is shown to have small world characteristics.Furthermore,terms are extracted as keywords that have high contribution to the graph being small world.Such words connect multiple clusters, i.e., concepts,thus they are important for the point of a document.

収録刊行物

被引用文献 (11)*注記

もっと見る

参考文献 (29)*注記

もっと見る

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ