意見分析コーパスの現状と課題

書誌事項

タイトル別名
  • Current Status and Issues on Sentiment Analysis Corpora

この論文をさがす

抄録

ネットメディアの発展とともに,ユーザ個人が発信する意見の影響は大きくなり,その利用方法は変遷し続けている.オンライン上の意見情報を分析することにより,消費活動や行動判断に有用な情報へのアクセスを支援する研究として,主に自然言語処理,情報検索,データ工学などの分野で,意見分析あるいは意見マイニングの研究が行われている.意見を分析するための表層的な特徴は,文書ジャンルあるいはメディアごとに異なることが知られており,ニュース,レビュー,ブログ,マイクロブログなど,さまざまな文書ジャンルごとにコーパスが重要な役割を果たす.本稿では,各文書ジャンルに代表的な意見分析コーパスの構築方針について説明し,最新の意見分析研究における,コーパスの活用事例や,従来の枠にとどまらない新たな取り組みについて,文書ジャンルごとに整理する.また,コーパス構築の課題を解消するための取り組みとその適用の基準について議論する.

With the rapid growing of internet media, consumer generated opinions are referred by many users and also utilized for variety of applications nowadays. To access of the valuable online sentiments and support the consuming or political decision, opinion mining and sentiment analysis researches are conducted in NLP, IR or DE fields. Surface sentiment expressions are described in a different style according to document genre or media, so developing sentiment corpus in each media, such as news, reviews, blogs, or microblogs is valuable and important. In this paper, we explain the annotation policy of representative sentiment corpora according to the document genre and summarize recent direction in researches using sentiment analysis corpora to clarify new annotation features and corpus usage methods. We also discuss criteria to solve annotation efforts in creating sentiment corpora.

収録刊行物

関連プロジェクト

もっと見る

詳細情報 詳細情報について

  • CRID
    1050564287856744576
  • NII論文ID
    110009610565
  • NII書誌ID
    AA11464847
  • ISSN
    18827799
  • Web Site
    http://id.nii.ac.jp/1001/00095313/
  • 本文言語コード
    ja
  • 資料種別
    article
  • データソース種別
    • IRDB
    • CiNii Articles
    • KAKEN

問題の指摘

ページトップへ