DNAデータベースの構築と検索

書誌事項

タイトル別名
  • Building and Searching DNA Database

この論文をさがす

抄録

DNAは、生物の設計情報であり、4種類のヌクレオチド、A,T,C,Gの並び即ち塩基配列としてコードされている。DNAデータベースは、塩基配列とその配列に関する付属情報(生物学的意味を含む情報)から構成されている。DNAデータベースの構築は、DDBJ(日本DNAデータバンク)、NCBI(米国バイオテクノロジー情報センター)、EMBL(欧州分子生物学研究所)の三箇所で行われている。我々が所属するDDBJは静岡県三島市、NCBIは米国のワシントンDCにほど近いベセスダ市、EMBLはドイツのハイデルベルグ市にある。これら三箇所のデータバンク間では、毎日、コンピュータネットワークを用いて、最新のDNAデータが交換されている。交換されるデータには、新しく作成されたデータの他に、既に交換済みのデータについての更新情報も含まれている。DNAデータベースの各レコードは、図1に示されるような記述文法(DDBJ/EMBL/GenBankフォーマット)で表現されたテキストデータとしてファイルシステムに保存されている。しかし、DNAデータベースは10万件を突破する勢いで指数関数的に増加しているため、ファイルシステムによる構築や管理は、もはや効率や機能面で限界に達している。本発表では、UNIX環境下の関係データベースを用いてこのような問題点を解決するための方式やオブジェクト指向データベースとの間係について述べる。

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ