文書データベースへの効率的な索引付けとその更新に関する研究  [in Japanese] Efficient Indexing and Updating of Text Databases  [in Japanese]

    • 後藤 隆元 GOTO Takamoto
    • 九州大学大学院システム情報科学府 Graduate School of Information Science and Electrical Engineering, Kyushu University
    • 小野 廣隆 ONO Hirotaka
    • 九州大学大学院システム情報科学研究院 Graduate School of Information Science and Electrical Engineering, Kyushu University
    • 定兼 邦彦 SADAKANE Kunihiko
    • 九州大学大学院システム情報科学研究院 Graduate School of Information Science and Electrical Engineering, Kyushu University
    • 山下 雅史 YAMASHITA Masafumi
    • 九州大学大学院システム情報科学研究院 Graduate School of Information Science and Electrical Engineering, Kyushu University

Abstract

計算機の性能の向上や, インターネットの普及により, 我々が扱うデータの量は急速に増加している.そしてそれに伴い, 大きなデータの中から必要なデータを探し出す機会も多くなっている.しかし, 扱うデータの量が増えるにつれて検索に必要な時間計算量や空間計算量も増加するため, より効率の良い検索アルゴリズムが求められている.一般に, 文字列検索を行う際にはあらかじめ対象となるファイルに対して索引付けを行って検索しやすくしている.そこで, 本研究では複数のファイルを格納した文書データベースに対して, 圧縮接尾辞配列を用いた索引付けを行うことにより, 時間的にも空間的にも効率が良く, 検索漏れが生じない文字列検索アルゴリズムを提案する.

Because of the performance improvement of computers and popularization of the Internet, the amount of data is rapidly increasing. However, as the volume of data is increasing, the time and space complexities of searching and indexing them are increasing. Therefore, more efficient search algorithms are required. In general, we index target files in advance when we perform a string search so that we can search it quickly. In this study, we index the whole document database that stores multi-documents by compressed suffix array. We propose a text search algorithm which is efficient in both time and space.

Journal

IEICE technical report. Theoretical foundations of Computing   [List of Volumes]

IEICE technical report. Theoretical foundations of Computing 105(72), 1-8, 2005-05-13  [Table of Contents]

The Institute of Electronics, Information and Communication Engineers

References:  8

You must have a user ID to see the references.If you already have a user ID, please click "Login" to access the info.New users can click "Sign Up" to register for an user ID.

Preview

Preview

Codes

  • NII Article ID (NAID) :
    110003206458
  • NII NACSIS-CAT ID (NCID) :
    AN10013152
  • Text Lang :
    JPN
  • Article Type :
    ART
  • ISSN :
    09135685
  • NDL Article ID :
    7355550
  • NDL Source Classification :
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL Call No. :
    Z16-940
  • Databases :
    CJP  NDL  NII-ELS