統計情報制限下における RDF 問合せ最適化のための結合選択率の間接的見積り手法

IPSJ Open Access

Abstract

オープンデータの流行に後押しされ,昨今 RDF データが急増しており,SPARQL エンドポイントの性能向上が急務となっている.解決策の一つとしてキャッシュサーバの導入があるが,エンドポイントの負荷やネットワーク転送量のなどを最小化するためには,キャッシュサーバ上でのコストベースの問合せ最適化の実施が必要となる.コストベース最適化で行なわれる選択率見積りには,十分な統計情報を事前に取得しておくことが不可欠であるが,キャッシュサーバではそれが困難であるという問題がある.そこで本稿では,統計情報が制限された環境において,適用可能な SPARQL 問合せのための結合選択率見積り手法を提案する.提案する手法は,RDF 問合せで頻出する結合演算において,結合する 2 集合の結合選択率の統計情報が存在しなくても,その 2 集合と共通に結合する第三の集合との結合選択率を利用して,間接的に結合選択率を見積る手法である.実データを用いた実験を通じて,提案手法と従来の手法を比べた結果,提案した手法は改善の余地は残されているものの,従来手法と比べ大幅な (最大 11 桁) 精度改善を確認した.

Journal

Related Projects

See more

Details 詳細情報について

  • CRID
    1050574047092574848
  • NII Article ID
    170000151212
  • Web Site
    http://id.nii.ac.jp/1001/00146070/
  • Text Lang
    ja
  • Article Type
    conference paper
  • Data Source
    • IRDB
    • CiNii Articles
    • KAKEN

Report a problem

Back to top