大規模 Bigram-net の空間クラスタリングとそのテキスト検索への応用 : Bigram-net Galactic Spatialization

  • 高橋 裕信
    新情報処理開発機構つくば研究センター 情報ベース機能つくば研究室
  • 新田 義貴
    筑波大学
  • 遠藤 隆
    新情報処理開発機構つくば研究センター 情報ベース機能つくば研究室
  • 岡 隆一
    新情報処理開発機構つくば研究センター 情報ベース機能つくば研究室

書誌事項

タイトル別名
  • Clustering Method of Large-Scale Bigram-Network Specialization and Application to Text Retrieval

この論文をさがす

抄録

本報告ではテキストを時系列データと考える大規模なテキストデータベースを対象として, 単語を空間に配置し, 空間の距離を利用した文章の検索方式を提案する. まず, 形態素解析によって分節した単語をノードとして, 単語bigramの作るネットワークを構築する. 次にこのネットワークのノードを有限次元の空間中に, ノード群のクラスタリングを伴なう配置問題を考える. この配置問題は, 時系列方向での近傍共起性から, ノード間の距離を定義し, 有限の小さい次元の空間で効率よく分類 (クラスタリング) するために, 最適化関数を導入した非線形化した手法で解かれている. 本手法を新聞データベースのリアルタイム検索に適用した実験結果について述べる.

収録刊行物

参考文献 (2)*注記

もっと見る

詳細情報 詳細情報について

  • CRID
    1573105977276520064
  • NII論文ID
    110003278214
  • NII書誌ID
    AN10091225
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ