トピック教師なしデータからのトピック依存評価表現モデルの獲得(「主観表現処理の最前線」シンポジウム)  [in Japanese] Discriminative topic-sentiment analysis from unsupervised topic corpora  [in Japanese]

Abstract

評価文書に付与されているトピック情報を評価文書分類に利用することは有益であるが、本稿ではトピックモデルを用いて、トピックタグの付与されていない評価文書であっても、自動的にトピックを識別し評価文書分類を行う方法を提案する。Probabilistic Latent Semantic Analysis (PLSA)を用いてトピック構造をモデル化するが、モデルの学習を行う際には、トピック情報を極性間において共通に扱うために単語毎の極性事後確率を導入し、識別学習を行う。実験においては、提案手法によって評価文書分類精度が向上することと、学習によって得られたモデルから自動的にトピック依存評価表現辞書を構築できることを示す。

Topic information included in reviews can be beneficially used in sentiment analysis, and this paper proposes a method of performing sentiment analysis wherein topics are automatically differentiated even with review data without topic labels. Probabilistic Latent Semantic Analysis (PLSA) is used to model topic structure and then a model of sentiment words specific to the topic obtained so that accuracy of analysis is improved upon. When training the model, polarity posterior for each word are introduced to perform discriminative training in order that the topic information can be shared between polarities.

Journal

IEICE technical report. Natural language understanding and models of communication   [List of Volumes]

IEICE technical report. Natural language understanding and models of communication 107(480), 57-62, 2008-01-31  [Table of Contents]

The Institute of Electronics, Information and Communication Engineers

References:  14

You must have a user ID to see the references.If you already have a user ID, please click "Login" to access the info.New users can click "Sign Up" to register for an user ID.

Preview

Preview

Codes

  • NII Article ID (NAID) :
    110006935913
  • NII NACSIS-CAT ID (NCID) :
    AN10091225
  • Text Lang :
    JPN
  • Article Type :
    ART
  • ISSN :
    09135685
  • NDL Article ID :
    9413203
  • NDL Source Classification :
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL Call No. :
    Z16-940
  • Databases :
    CJP  NDL  NII-ELS 

Export