文書データベースへの効率的な索引付けとその更新に関する研究 Efficient Indexing and Updating of Text Databases

    • 後藤 隆元 GOTO Takamoto
    • 九州大学大学院システム情報科学府 Graduate School of Information Science and Electrical Engineering, Kyushu University
    • 小野 廣隆 ONO Hirotaka
    • 九州大学大学院システム情報科学研究院 Graduate School of Information Science and Electrical Engineering, Kyushu University
    • 定兼 邦彦 SADAKANE Kunihiko
    • 九州大学大学院システム情報科学研究院 Graduate School of Information Science and Electrical Engineering, Kyushu University
    • 山下 雅史 YAMASHITA Masafumi
    • 九州大学大学院システム情報科学研究院 Graduate School of Information Science and Electrical Engineering, Kyushu University

抄録

計算機の性能の向上や, インターネットの普及により, 我々が扱うデータの量は急速に増加している.そしてそれに伴い, 大きなデータの中から必要なデータを探し出す機会も多くなっている.しかし, 扱うデータの量が増えるにつれて検索に必要な時間計算量や空間計算量も増加するため, より効率の良い検索アルゴリズムが求められている.一般に, 文字列検索を行う際にはあらかじめ対象となるファイルに対して索引付けを行って検索しやすくしている.そこで, 本研究では複数のファイルを格納した文書データベースに対して, 圧縮接尾辞配列を用いた索引付けを行うことにより, 時間的にも空間的にも効率が良く, 検索漏れが生じない文字列検索アルゴリズムを提案する.

Because of the performance improvement of computers and popularization of the Internet, the amount of data is rapidly increasing. However, as the volume of data is increasing, the time and space complexities of searching and indexing them are increasing. Therefore, more efficient search algorithms are required. In general, we index target files in advance when we perform a string search so that we can search it quickly. In this study, we index the whole document database that stores multi-documents by compressed suffix array. We propose a text search algorithm which is efficient in both time and space.

収録刊行物

電子情報通信学会技術研究報告. COMP, コンピュテーション   [巻号一覧]

電子情報通信学会技術研究報告. COMP, コンピュテーション 105(72), 1-8, 2005-05-13  [この号の目次]

一般社団法人電子情報通信学会

参考文献:  8件

参考文献を見るにはログインが必要です。ユーザIDをお持ちでない方は新規登録してください。

プレビュー

プレビュー

各種コード

  • NII論文ID(NAID) :
    110003206458
  • NII書誌ID(NCID) :
    AN10013152
  • 本文言語コード :
    JPN
  • 資料種別 :
    ART
  • ISSN :
    09135685
  • NDL 記事登録ID :
    7355550
  • NDL 雑誌分類 :
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL 請求記号 :
    Z16-940
  • 収録DB :
    CJP書誌  NDL  NII-ELS