意見抽出のための評価表現の収集 Collecting Evaluative Expressions for Opinion Extraction

この論文にアクセスする

著者

抄録

近年, web上に多数存在する掲示板などの文書から, 意見を自動的に収集・解析する技術への関心が高まっている.このような意見情報の抽出には, 評価を表す表現が重要な手がかりとなるが, それらの表現には「燃費がよい」「CGがきれい」といった領域依存の表現が多数存在するため, 人手で書き尽くすことは困難である.そこで, 我々は, 評価対象表現, 属性表現, 評価表現の共起情報を利用して, これら領域依存の表現を効率的に収集することを試みた.本稿では, 共起パタンに基づく属性・評価値表現の半自動的収集方法を提案し, 「コンピュータ」と「ゲーム」の2つの領域を対象に, 人手と提案手法で行なった収集効率実験の結果について報告する.

Increasing interest is recently observed in the method of extracting human opinions from a large scale of heterogeneous text data such as Web documents.To automate the process of opinion extraction, having a collection of evaluative expressions such as "<I>the seats are comfortable</I>" would be useful.However, it can be prohibitively costly to manually create an exhaustive list of such expressions for many domains, because they tend to be domain-dependent.Motivated by this background, we have been exploring the way to accelerate the process of collecting evaluative expressions by applying a text mining technique.This paper proposes a semi-automatic method that uses particular cooccurrence patterns of evaluated subjects, focused attributes and values.Experimental results show its efficiency compared to manual collection of those expressions.

収録刊行物

  • 自然言語処理

    自然言語処理 12(3), 203-222, 2005

    一般社団法人 言語処理学会

各種コード

  • NII論文ID(NAID)
    130004291853
  • 本文言語コード
    JPN
  • ISSN
    1340-7619
  • データ提供元
    J-STAGE 
ページトップへ