STVF符号--頻度刈り込み接尾辞木を用いた効率よいVF符号化 STVF code: an efficient VF coding using frequency-base-pruned suffix tree

この論文にアクセスする

この論文をさがす

抄録

本論文では,刈り込み接尾辞木を用いた新たな可変情報源系列固定長符号化(VF符号化)の手法を提案する.この符号化手法は,頻度情報に基づいて刈り込んだ接尾辞木を文節木として用いてVF符号化する.VF符号は,すべての符号語が等長であるという工学的に好ましい性質があり,圧縮パターン照合などへの重要な応用がある.実験の結果,提案符号は,自然言語文書などに対して約41%の圧縮率を達成しており,良く知られているHuffman符号や,古典的なVF符号であるTunstall符号よりも圧縮性能が良いことがわかった.In this paper, we propose a new VF-coding method. It uses a frequency-base-pruned suffix tree as a parse tree. VF codes have some desirable features from engineering aspects, and there are some important applications such as compressed pattern matching. Experimental results show that the proposed code achieves the compression ratio of about 41% for a natural language text, which is better than Tunstall code and Huffman code.

収録刊行物

  • 日本データベース学会論文誌

    日本データベース学会論文誌 8(1), 125-130, 2009-06

    日本データベース学会

被引用文献:  5件中 1-5件 を表示

各種コード

  • NII論文ID(NAID)
    40016752610
  • NII書誌ID(NCID)
    AA12331521
  • 本文言語コード
    JPN
  • 資料種別
    Journal Article
  • ISSN
    18831060
  • NDL 記事登録ID
    10368737
  • NDL 雑誌分類
    ZM13(科学技術--科学技術一般--データ処理・計算機)
  • NDL 請求記号
    Z74-D304
  • データ提供元
    CJP引用  NDL  IR 
ページトップへ