Twitterにおけるユーザの興味と話題の時間発展を考慮したオンライン学習可能なトピックモデルの提案
書誌事項
- タイトル別名
-
- A Proposal of Online Topic Model for Twitter Considering Temporal Dynamics of User Interests and Topic Trends
この論文をさがす
抄録
Latent Dirichlet Allocation(LDA)は,様々な分野で応用されているトピックモデルであり,Twitterにおけるユーザ属性の推定や話題の要約などに適用した研究も数多く報告され始めている.LDAをツイート集合に適用する場合,1ツイートを1文書とすると,文書の短さやノイズの多さにより,LDAが有効に機能しないことが多いため,1ユーザの全ツイートを1文書とする方法が一般的に用いられる.これに対して,1ツイートが1トピックからなるという仮定に基づいたトピックモデルであるTwitter-LDAが提案され,前者の方法に比べて,トピックの意味のまとまりの面で優れていると報告されている.しかし一方でTwitter-LDAは,オンライン学習ができないという課題がある.本論文では,Twitter-LDAを改良し,Twitterに適したオンライン学習可能なトピックモデルを提案する.提案モデルでは以下の2点についてTwitter-LDAを拡張する.第1に,一般語とトピック語との比率をユーザごとに推定することで,より高精度にツイートの生成過程をモデル化する.第2に,ユーザの購買行動をモデル化したTopic Tracking Model(TTM)の機構をモデルに加えることで,Twitterにおけるユーザの興味と話題の時間発展をオンラインで学習可能とする.
Latent Dirichlet Allocation (LDA) is a topic model which has been applied to various fields. It has been also applied to user profiling or event summarization on Twitter. In the application of LDA to tweet collection, it generally treats aggregated all tweets of a user as a single document. On the other hand, Twitter-LDA which assumes a single tweet consists of a single topic has been proposed and showed that it is superior to the former way in topic semantic coherence. However, Twitter-LDA has a problem that it is not capable of online inference. In this paper, we extend Twitter-LDA in the following two points. First, we model the generation process of tweets more accurately by estimating the ratio between topic words and general words for each user. Second, we enable it to estimate temporal dynamics of user interests and topic trends in online based on Topic Tracking Model (TTM) which models consumer purchase behaviors.
収録刊行物
-
- 情報処理学会論文誌数理モデル化と応用(TOM)
-
情報処理学会論文誌数理モデル化と応用(TOM) 7 (1), 53-60, 2014-03-28
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1050564287857869056
-
- NII論文ID
- 110009691641
-
- NII書誌ID
- AA11464803
-
- ISSN
- 18827780
-
- Web Site
- http://id.nii.ac.jp/1001/00099685/
-
- 本文言語コード
- ja
-
- 資料種別
- article
-
- データソース種別
-
- IRDB
- CiNii Articles