レビューサイトにおける多項分布に基づくレジームスイッチング検出手法と可視化への応用

Bibliographic Information

Other Title
  • Detecting Switching Regimes Based on Multinomial Distribution in Buzz Marketing Sites and Its Application for Visualizing

Search this article

Abstract

大規模レビューサイトにおけるレビューの評点情報は,ユーザの購買行動に大きな影響を与えている可能性がある.本論文では,それらのレビュー評点の付けられ方は,なんらかの理由によって時間とともに変化していると考え,その傾向変化をレジームスイッチングに基づくタイムラインとして可視化する手法を提案する.提案手法は,まず,各レジームにおけるユーザの基本評点行動は多項分布に従っていると仮定し,観測された評点時系列データにおける尤度を最大化することによって,それらのモデルパラメータとスイッチング時刻を推定する.そして,推定されたスイッチング時刻から確率関数を計算し,レジームスイッチングに基づくタイムライン,それに関連した樹形図,および,類似した変化傾向の評点確率関数の可視化結果を生成する.真のモデルパラメータから生成した人工データと,現実の大規模レビューサイトのデータを用いた実験において,提案手法が正確かつ解釈可能な可視化結果を生成できることを示す.

The review scoring results in large-scale buzz marketing sites can greatly affect actual purchase activities of many users. In this paper, since the scoring tendency for an item usually changes over time due to several reasons, we propose a method for visualizing its scoring time series data as a timeline based on switching regimes. Namely, by assuming that fundamental scoring behavior of users in each regime obeys a multinomial distribution model, we first estimate the switching time steps and the model parameters by maximizing the likelihood of generating the observed scoring time series data, and then produce their timelines, their associated dendrogram, and the groups of similar timelines for scores as our final visualization results by calculating the probability function from the estimated switching regimes. In our experiments using synthetic time series data generated from a known ground truth model and real scoring time series data collected from a Japanese buzz marketing site, we show that our proposed method can produce accurate and interpretable visualization results for such time series data.

Journal

Related Projects

See more

Details 詳細情報について

Report a problem

Back to top