統計情報制限下における RDF 問合せ最適化のための結合選択率の間接的見積り手法
Abstract
オープンデータの流行に後押しされ,昨今 RDF データが急増しており,SPARQL エンドポイントの性能向上が急務となっている.解決策の一つとしてキャッシュサーバの導入があるが,エンドポイントの負荷やネットワーク転送量のなどを最小化するためには,キャッシュサーバ上でのコストベースの問合せ最適化の実施が必要となる.コストベース最適化で行なわれる選択率見積りには,十分な統計情報を事前に取得しておくことが不可欠であるが,キャッシュサーバではそれが困難であるという問題がある.そこで本稿では,統計情報が制限された環境において,適用可能な SPARQL 問合せのための結合選択率見積り手法を提案する.提案する手法は,RDF 問合せで頻出する結合演算において,結合する 2 集合の結合選択率の統計情報が存在しなくても,その 2 集合と共通に結合する第三の集合との結合選択率を利用して,間接的に結合選択率を見積る手法である.実データを用いた実験を通じて,提案手法と従来の手法を比べた結果,提案した手法は改善の余地は残されているものの,従来手法と比べ大幅な (最大 11 桁) 精度改善を確認した.
Journal
-
- 第8回Webとデータベースに関するフォーラム論文集
-
第8回Webとデータベースに関するフォーラム論文集 2015 126-133, 2015-11-17
- Tweet
Details 詳細情報について
-
- CRID
- 1050574047092574848
-
- NII Article ID
- 170000151212
-
- Web Site
- http://id.nii.ac.jp/1001/00146070/
-
- Text Lang
- ja
-
- Article Type
- conference paper
-
- Data Source
-
- IRDB
- CiNii Articles
- KAKEN