高速復元可能な接尾辞配列圧縮法 A Compression Method of Suffix Arrays with Fast Decoding

この論文をさがす

著者

抄録

大規模文字列データに対する高速な文字列検索は接尾辞配列(SA)を用いて実現できるが,SAには多くの容量が必要になってしまう.SAを圧縮する様々な方法が提案されているが,本論文では出現頻度の高いフレーズの検索が既存の圧縮法に比べて高速な圧縮法を提案する.提案手法では,SAをブロックに分割し,そのブロック内でソートを行い,差分をとったものを保存し,検索時は差分からソート後のSAを取り戻し,区間内をすべて逐次的に検索する.これで検索フレーズのすべての出現位置を得ることができる.実験により,特に検索フレーズの頻度が高い場合,多くの入力データで提案手法の性能が既存の方法より優れていることを示す.

収録刊行物

  • 電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (Japanese edition)

    電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (Japanese edition) 93(8), 1567-1575, 2010-08-01

    一般社団法人電子情報通信学会

参考文献:  9件中 1-9件 を表示

各種コード

  • NII論文ID(NAID)
    110007681693
  • NII書誌ID(NCID)
    AA12099634
  • 本文言語コード
    JPN
  • 資料種別
    ART
  • ISSN
    18804535
  • NDL 記事登録ID
    10798860
  • NDL 雑誌分類
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL 請求記号
    Z16-779
  • データ提供元
    CJP書誌  NDL  NII-ELS 
ページトップへ