トピック教師なしデータからのトピック依存評価表現モデルの獲得  [in Japanese] Discriminative topic-sentiment analysis from unsupervised topic corpora  [in Japanese]

Search this Article

Author(s)

Abstract

評価文書に付与されているトピック情報を評価文書分類に利用することは有益であるが、本稿ではトピックモデルを用いて、トピックタグの付与されていない評価文書であっても、自動的にトピックを識別し評価文書分類を行う方法を提案する。Probabilistic Latent Semantic Analysis (PLSA)を用いてトピック構造をモデル化するが、モデルの学習を行う際には、トピック情報を極性間において共通に扱うために単語毎の極性事後確率を導入し、識別学習を行う。実験においては、提案手法によって評価文書分類精度が向上することと、学習によって得られたモデルから自動的にトピック依存評価表現辞書を構築できることを示す。

Topic information included in reviews can be beneficially used in sentiment analysis, and this paper proposes a method of performing sentiment analysis wherein topics are automatically differentiated even with review data without topic labels. Probabilistic Latent Semantic Analysis (PLSA) is used to model topic structure and then a model of sentiment words specific to the topic obtained so that accuracy of analysis is improved upon. When training the model, polarity posterior for each word are introduced to perform discriminative training in order that the topic information can be shared between polarities.

Journal

  • IEICE technical report

    IEICE technical report 107(480), 57-62, 2008-02-07

    The Institute of Electronics, Information and Communication Engineers

References:  14

Codes

  • NII Article ID (NAID)
    110006935913
  • NII NACSIS-CAT ID (NCID)
    AN10091225
  • Text Lang
    JPN
  • Article Type
    ART
  • ISSN
    09135685
  • NDL Article ID
    9413203
  • NDL Source Classification
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL Call No.
    Z16-940
  • Data Source
    CJP  NDL  NII-ELS 
Page Top