複合イベントストリームのための特徴自動抽出

IPSJ HANDLE Open Access

Bibliographic Information

Other Title
  • Automatic Mining of Complex Event Streams

Search this article

Abstract

複数の属性(乗車時間,乗車エリア,降車エリア,タクシーの種類,顧客の属性…)を含むタクシー乗車データなどに代表される,時間情報をともなうイベント集合は,テンソルストリームとして扱うことができる.本論文では複雑かつ大規模なイベントテンソルストリームから,類似時系列パターンや属性内における潜在グループを自動で抽出するTRICOMPを提案する.TRICOMPは(a)時系列パターンや属性間における類似した特徴を明らかにし,(b)それらの特徴をパラメータのチューニングを行うことなく自動的に抽出し要約する.また,(c)計算時間はデータストリームの長さに依存せず,高速に処理を行う.実データを用いた実験では,TRICOMPが複雑なイベントストリームから時系列変化を正確にとらえ,潜在グループや時系列パターンといった,データの解釈を助ける特徴を自動的に発見することを確認した.また,提案手法が,最新の既存手法と比較して高精度であり,計算時間について大幅な性能向上を達成していることを明らかにした.

Given that large tensor streams of time-evolving events such as taxi rides, which contain multiple attributes (e.g., pick up time, pick up area, drop off area, taxi type, customer attribute...) are difficult to comprehend, how do we obtain intuitive groups and patterns? Also, how do we incrementally capture latent structure and typical patterns to achieve a meaningful summarization? In this paper, we propose a streaming algorithm, namely TRICOMP, which is designed to automatically find both typical patterns and latent groups in such complex yet huge collections. Our method has the following advantages: (a) it is Effective: it provides compact and powerful representations that reveal similar features with respect to both time and attributes. (b) it is Automatic: it automatically recognizes and summarizes them without any parameter tuning. (c) it is Scalable: it is incremental yet scalable, and thus requires computational time that is independent of data stream length. Extensive experiments on real datasets demonstrate that TRICOMP provides a summarization that helps us understand the complicated data and that consistently outperforms the state-of-the-art methods in terms of both execution speed and accuracy.

Journal

Related Projects

See more

Details 詳細情報について

Report a problem

Back to top