PCFGと分岐HMMを用いた構文解析 Parsing with PCFG and Branching HMM

この論文にアクセスする

この論文をさがす

著者

    • 宮尾 祐介 Miyao Yusuke
    • 東京大学大学院 情報理工学系研究科 Graduate School of Information Science and Technology, University of Tokyo
    • 辻井 潤一 Tsujii Jun'ichi
    • 東京大学大学院 情報理工学系研究科 Graduate School of Information Science and Technology, University of Tokyo:CREST JST

抄録

本論文では、構文木の生成モデルである分岐HMMという確率モデルを定義し、構文解析済みのコーパスを訓練データとしたEMアルゴリズムを用いて分岐HMMのパラメータ推定を行うことで、詳細化されたCFG規則を自動的に学習する手法を提案する。また、PCFGを用いて得た複数の解析候補を分岐HMMによってリランキングする実験を行い,分岐HMMの学習によって自動的に得た詳細化されたCFG規則が構文解析の精度を向上させることを確かめた。This paper defines a generative probability model of parse trees, which we call the branching HMM. A branching HMM can automatically learn fine-grained CFG rules from a parsed corpus by an EM-style estimation algorithm. The effectiveness of automatically learned CFG rules in parsing is demonstrated through experiments in which tentative parse results by a PCFG is re-ranked by a branching HMM.

This paper defines a generative probability model of parse trees, which we call the branching HMM. A branching HMM can automatically learn fine-grained CFG rules from a parsed corpus by an EM-style estimation algorithm. The effectiveness of automatically learned CFG rules in parsing is demonstrated through experiments in which tentative parse results by a PCFG is re-ranked by a branching HMM.

収録刊行物

  • 情報処理学会研究報告自然言語処理(NL)

    情報処理学会研究報告自然言語処理(NL) 2004(93(2004-NL-163)), 107-114, 2004-09-17

    一般社団法人情報処理学会

各種コード

  • NII論文ID(NAID)
    110002949414
  • NII書誌ID(NCID)
    AN10115061
  • 本文言語コード
    JPN
  • 資料種別
    Technical Report
  • データ提供元
    NII-ELS  IPSJ 
ページトップへ