位置・ソーシャル関係・キーワードに基づくTop-kデータモニタリング

Bibliographic Information

Other Title
  • Geo-social Keyword Top-k Data Monitoring

Search this article

Abstract

近年,多くのアプリケーションでは,PoI(Point of Interest)がパブリッシュ/サブスクライブ(Pub/Sub)モデルに基づいてデータを発信しており,ユーザは生成されたデータの中から自身が興味を持つもののみを取得する.また,位置情報サービスやソーシャルネットワークサービスの普及により,位置やキーワード,ソーシャル関係を用いた検索への関心が高まっている.本研究では,Pub/Subモデルで生成されたデータから,ユーザにとって有用な上位k個のデータ(Top-kデータ)をモニタリングする問題に取り組む.この上位k個のデータを収集する際,PoIの位置,指定したキーワードとの一致度,およびデータを生成したPoIとのソーシャル関係からデータのスコアを計算する.データが発生した際に,すべてのクエリに対してTop-kデータの更新をチェックする方法は,多数のクエリが存在する環境に対応できない.この問題を解決するため,クエリを四分木により管理し,発生したデータが上位k個となりうるクエリにのみアクセスするアルゴリズムを提案する.実データを用いた実験により,提案アルゴリズムの有効性を示す.

Recently, in many applications, PoIs have generated data objects based on Publish/Subscribe (Pub/Sub) model, and users receive only their preferable data objects. In addition, due to the prevalence of location based services and social network services, locations, keywords, and social relationships are considered to be meaningful for data retrieval. In this paper, we address the problem of monitoring k data objects that are the most relevant to users' preferences, where the score of a data object is calculated based on the location of PoI, the user-specified keywords, and the social relationship between the user and the PoI that generates the data object. If we have a lot of queries, it is time-consuming to access all queries when a data object is generated. To solve this problem, we propose an algorithm that maintains queries with a Quad-tree and accesses only queries with possibilities that a generated data object becomes top-k data objects. Our experiments using real datasets verify the effectiveness of our proposed algorithm.

Journal

Related Projects

See more

Details 詳細情報について

Report a problem

Back to top