大規模 Bigram-net の空間クラスタリングとそのテキスト検索への応用 : Bigram-net Galactic Spatialization
書誌事項
- タイトル別名
-
- Clustering Method of Large-Scale Bigram-Network Specialization and Application to Text Retrieval
この論文をさがす
抄録
本報告ではテキストを時系列データと考える大規模なテキストデータベースを対象として, 単語を空間に配置し, 空間の距離を利用した文章の検索方式を提案する. まず, 形態素解析によって分節した単語をノードとして, 単語bigramの作るネットワークを構築する. 次にこのネットワークのノードを有限次元の空間中に, ノード群のクラスタリングを伴なう配置問題を考える. この配置問題は, 時系列方向での近傍共起性から, ノード間の距離を定義し, 有限の小さい次元の空間で効率よく分類 (クラスタリング) するために, 最適化関数を導入した非線形化した手法で解かれている. 本手法を新聞データベースのリアルタイム検索に適用した実験結果について述べる.
収録刊行物
-
- 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション
-
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 97 (330), 41-47, 1997-10-17
一般社団法人電子情報通信学会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1573105977276520064
-
- NII論文ID
- 110003278214
-
- NII書誌ID
- AN10091225
-
- 本文言語コード
- ja
-
- データソース種別
-
- CiNii Articles