正誤判別規則学習を用いた複数の日本語固有表現抽出システムの出力の混合 Learning to Combine Outputs of Multiple Japanese Named Entity Extractors

この論文にアクセスする

この論文をさがす

著者

抄録

本論文では,日本語固有表現抽出の問題において,複数のモデルの出力を混合する手法を提案する.混合の方式としては,複数のシステム・モデルの出力(および訓練データそのもの)を入力とする第二段の学習器を用いて,複数のシステム・モデルの出力の混合を行なう規則を学習するという混合法(stacking法)を採用する.第二段の学習器として決定リスト学習を用いて,最大エントロピー法に基づく固有表現抽出モデルのうち,お互いに挙動の異なる固定文脈長モデルと可変文脈長モデルの出力を混合する実験を行なった結果,最大エントロピー法に基づく固有表現抽出モデルにおいてこれまで得られていた最高の性能を上回る性能が達成された.In this paper, we propose a method for learning a classifier which combines outputs of more than one Japanese named entity extractors. Individual models to be combined are based on maximum entropy models, one of which always considers surrounding contexts of a fixed length, while the other considers those of variable lengths according to the number of constituent morphemes of named entities. Experimental evaluation shows that the proposed method achieves improvement over the best known results with named entity extractors based on maximum entropy models.

In this paper, we propose a method for learning a classifier which combines outputs of more than one Japanese named entity extractors. Individual models to be combined are based on maximum entropy models, one of which always considers surrounding contexts of a fixed length, while the other considers those of variable lengths according to the number of constituent morphemes of named entities. Experimental evaluation shows that the proposed method achieves improvement over the best known results with named entity extractors based on maximum entropy models.

収録刊行物

  • 情報処理学会研究報告自然言語処理(NL)

    情報処理学会研究報告自然言語処理(NL) 2001(69(2001-NL-144)), 31-38, 2001-07-16

    一般社団法人情報処理学会

参考文献:  13件中 1-13件 を表示

各種コード

  • NII論文ID(NAID)
    110002935307
  • NII書誌ID(NCID)
    AN10115061
  • 本文言語コード
    JPN
  • 資料種別
    Technical Report
  • ISSN
    09196072
  • NDL 記事登録ID
    5866174
  • NDL 雑誌分類
    ZM13(科学技術--科学技術一般--データ処理・計算機)
  • NDL 請求記号
    Z14-1121
  • データ提供元
    CJP書誌  NDL  NII-ELS  IPSJ 
ページトップへ