極小かつ非冗長な可変長ワイルドカード領域をもつ頻出パターンの抽出 Extraction of Non-redundant Frequent Sequence Patterns with Minimum Cover on Variable-Length Wildcard Regions

この論文にアクセスする

この論文をさがす

著者

抄録

筆者らは,分子配列データベースから生物学的に重要な機能をもつ特徴的なパターンであるモチーフの候補である頻出パターンを抽出するために,極小な可変長ワイルドカード領域をもつ頻出パターンを導き出す方法を提案する.この方法は,k-頻出パターン(長さkの頻出パターン)から(k+1)-頻出パターンを生成するパターン成長アプローチを拡張し,k-頻出パターンごとにスコープデータベースを作成する.k-頻出パターンのスコープデータベースは,従来の射影データベースに含まれるスキャン開始位置の情報に、ユーザにより定められた参照範囲の情報とそれまでに求まった可変長のk-頻出パターンに対するすべてのオカーレンスの情報を加えている.これにより,抽出される可変長の(k+1)-頻出パターンの可変長ワイルドカード領域が非極小,または冗長になることを回避することができる.スコープデータベースの有効性を示すため,PROSITEからLeucine Zipper モチーフ及びZinc Finger モチーフを含むデータセットをそれぞれ取り出し,各データセットに対して可変長の頻出パターンを抽出する能力の評価を行ったので,その結果を報告する.

収録刊行物

  • 電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (Japanese edition)

    電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (Japanese edition) 90(2), 281-291, 2007-02-01

    電子情報通信学会

参考文献:  12件中 1-12件 を表示

被引用文献:  4件中 1-4件 を表示

各種コード

  • NII論文ID(NAID)
    110007380660
  • NII書誌ID(NCID)
    AA12099634
  • 本文言語コード
    JPN
  • 資料種別
    ART
  • ISSN
    18804535
  • NDL 記事登録ID
    8670918
  • NDL 雑誌分類
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL 請求記号
    Z16-779
  • データ提供元
    CJP書誌  CJP引用  NDL  NII-ELS  IR 
ページトップへ