3つ以下の候補から係り先を選択する係り受け解析モデル

  • 金山 博
    東京大学大学院理学系研究科情報科学
  • 鳥澤 健太郎
    東京大学大学院理学系研究科情報科学 科学技術事業団さきがけ研究21, PRESTO
  • 光石 豊
    東京大学大学院理学系研究科情報科学
  • 辻井 潤一
    東京大学大学院理学系研究科情報科学 マンチェスター工科大計算言語学センター

書誌事項

タイトル別名
  • A Statistical Japanese Dependency Analysis Model with Choice Restricted to at Most Three Modification Candidates
  • 3ツ イカ ノ コウホ カラ カカリ サキ オ センタク スル カカリウケ カイセキ モデル

この論文をさがす

抄録

This paper describes a statistical method for Japanese dependency analysis. The method differs from conventional statistical models in the way of calculating statistical values. The conventional models calculate the probability of a correct dependency between two bunsetsus (phrasal units of Japanese) for each pair of bunsetsus. On the other hand, we propose the triplet/quadruplet model, in which the conditional part of the probability consists of information on a modifier bunsetsu and all its modification candidates, and the probability that a candidate is chosen as the modifiee is calculated. The number of candidates is restricted to three or less by an HPSG-based grammar and heuristics. With a maximum entropy estimation, our parser achieves high accuracy: 88.6% for the analysis of the EDR annotated corpus.

収録刊行物

  • 自然言語処理

    自然言語処理 7 (5), 71-91, 2000

    一般社団法人 言語処理学会

被引用文献 (8)*注記

もっと見る

参考文献 (19)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ