トピックと属性を用いたブートストラップ法に基づく語彙獲得 Entity Set Expansion based on Bootstrap Methods using the Topic Features and Attribute Constraints

この論文にアクセスする

この論文をさがす

抄録

本稿ではコーパスからの語彙獲得を行う際に,トピック情報と属性情報を用いる手法を提案する.語彙が用いられている文書のトピックをトピックモデルを用いて推定し,新たな語彙獲得の際の素性として用いる.また,語彙が共通して持つ属性を文書中から選択し,それを語彙選択の制約条件として用いる.提案手法を用いることでセマンティックドリフトを軽減し,語彙の獲得精度が向上したことを示す.This paper proposes a bootstrapping entity set expansion method that utilizes the information of topics and attributes. In order to reduce the effect of semantic drifts, we introduce two distinctive features. The first is the topic of each document estimated by topic models. These topic features are used for the discriminative models. The second is the attributes occurring around entities. These attribute features are used as the constraints on candidate search of new entities. The experiments show that the accuracy of the extracted entities was improved.

収録刊行物

  • 研究報告自然言語処理(NL)

    研究報告自然言語処理(NL) 2010-NL-199(12), 1-8, 2010-11-11

    情報処理学会

各種コード

  • NII論文ID(NAID)
    110008003314
  • NII書誌ID(NCID)
    AN10115061
  • 本文言語コード
    JPN
  • 資料種別
    Technical Report
  • ISSN
    1884-0930
  • NDL 記事登録ID
    025125139
  • NDL 請求記号
    YH247-911
  • データ提供元
    NDL  NII-ELS  IPSJ 
ページトップへ