辞書とタグ無しコーパスを用いた固有表現抽出器の学習法

書誌事項

タイトル別名
  • ジショ ト タグ ナシ コーパス オ モチイタ コユウ ヒョウゲン チュウシュツキ ノ ガクシュウホウ

この論文をさがす

抄録

<p>本稿では,少量の固有表現とそのクラスを登録した辞書とタグ無しコーパスから固有表現抽出器を学習する方法を述べる.単純に,辞書の固有表現の出現を正例,それ以外を負例とすると,辞書で定義された固有表現ではない(偽の正例),辞書にない固有表現(偽の負例),が含まれる.提案法は,1)偽の学習データを除去して固有表現抽出器を学習,2)固有表現抽出器で辞書を増殖して1に戻る,のブートストラップ法を採用する.</p>

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ