オンライン活動データストリームのための非線形モデル解析

IPSJ HANDLE Open Access

Bibliographic Information

Other Title
  • Non-linear Mining of Social Activities in Tensor Streams

Search this article

Abstract

Web検索履歴等に代表される大規模時系列データは,時刻や地域,キーワードといった様々な情報とともに収集され,テンソルストリームとして扱うことができる.Web上におけるユーザアクティビティの解析では,より高精度な将来予測を実現することが重要な課題の1つであるが,複雑な構造を持つテンソルストリームから将来予測に有用なパターンを発見することが問題となる.本論文では,時間,国,キーワードの3つ組に対するWeb検索数で構成されるテンソルストリームを効果的に解析するためのストリームアルゴリズムであるCUBECASTを提案する.CUBECASTは与えられたテンソルストリームに含まれる潜在的な長期トレンドと季節パターンを発見し,それらを基に類似した特徴を持つ地域グループへと分解する.このとき,提案手法は次の特長を持つ.(a)長期トレンドと季節パターンの非線形特性を単一のモデルで表現する.(b)パラメータチューニングや事前知識を必要とせず,時系列モデルやパターン変化を自動的に推定する.(c)逐次的かつ適応的にパターン変化をとらえ,テンソルストリームを効率的に処理する.実データを用いた実験では,提案手法が将来予測に有用なパターンを効果的かつ効率的に発見できることを示し,既存の時系列予測手法と比較して,予測精度,計算時間の改善を確認した.

Given a large time-evolving event series such as Google web-search logs, which are collected according to various aspects, i.e., timestamps, locations and keywords, how accurately can we forecast their future activities? How can we reveal significant patterns that allow us to long-term forecast from such complex tensor streams? In this paper, we propose a streaming method, namely, CUBECAST, that is designed to capture basic trends and seasonality in tensor streams and extract temporal and multi-dimensional relationships between such dynamics. Our proposed method has the following properties: (a) it is effective: it finds both trends and seasonality and summarizes their dynamics into simultaneous non-linear latent space. (b) it is automatic: it automatically recognizes and models such structural patterns without any parameter tuning or prior information. (c) it is scalable: it incrementally and adaptively detects shifting points of patterns for a semi-infinite collection of tensor streams. Extensive experiments that we conducted on real datasets demonstrate that our algorithm can effectively and efficiently find meaningful patterns for generating future values, and outperforms the state-of-the-art algorithms for time series forecasting in terms of forecasting accuracy and computational time.

Journal

Related Projects

See more

Details 詳細情報について

Report a problem

Back to top