トピック教師なしデータからのトピック依存評価表現モデルの獲得(「主観表現処理の最前線」シンポジウム) Discriminative topic-sentiment analysis from unsupervised topic corpora

抄録

評価文書に付与されているトピック情報を評価文書分類に利用することは有益であるが、本稿ではトピックモデルを用いて、トピックタグの付与されていない評価文書であっても、自動的にトピックを識別し評価文書分類を行う方法を提案する。Probabilistic Latent Semantic Analysis (PLSA)を用いてトピック構造をモデル化するが、モデルの学習を行う際には、トピック情報を極性間において共通に扱うために単語毎の極性事後確率を導入し、識別学習を行う。実験においては、提案手法によって評価文書分類精度が向上することと、学習によって得られたモデルから自動的にトピック依存評価表現辞書を構築できることを示す。

Topic information included in reviews can be beneficially used in sentiment analysis, and this paper proposes a method of performing sentiment analysis wherein topics are automatically differentiated even with review data without topic labels. Probabilistic Latent Semantic Analysis (PLSA) is used to model topic structure and then a model of sentiment words specific to the topic obtained so that accuracy of analysis is improved upon. When training the model, polarity posterior for each word are introduced to perform discriminative training in order that the topic information can be shared between polarities.

収録刊行物

電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション   [巻号一覧]

電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 107(480), 57-62, 2008-01-31  [この号の目次]

社団法人電子情報通信学会

参考文献:  14件

参考文献を見るにはログインが必要です。ユーザIDをお持ちでない方は新規登録してください。

プレビュー

プレビュー

各種コード

  • NII論文ID(NAID) :
    110006935913
  • NII書誌ID(NCID) :
    AN10091225
  • 本文言語コード :
    JPN
  • 資料種別 :
    ART
  • ISSN :
    09135685
  • NDL 記事登録ID :
    9413203
  • NDL 雑誌分類 :
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL 請求記号 :
    Z16-940
  • 収録DB :
    CJP書誌  NDL  NII-ELS