3つ以下の候補から係り先を選択する係り受け解析モデル  [in Japanese] A Statistical Japanese Dependency Analysis Model with Choice Restricted to at Most Three Modification Candidates  [in Japanese]

Access this Article

Search this Article

Author(s)

    • 金山 博 KANAYAMA Hiroshi
    • 東京大学大学院理学系研究科情報科学専攻 Department of Information Science, Graduate School of Science, University of Tokyo
    • 鳥澤 健太郎 TORISAWA Kentaro
    • 東京大学大学院理学系研究科情報科学専攻 Department of Information Science, Graduate School of Science, University of Tokyo
    • 光石 豊 [他] MITSUISHI Yutaka
    • 東京大学大学院理学系研究科情報科学専攻 Department of Information Science, Graduate School of Science, University of Tokyo
    • 辻井 潤一 TSUJII Jun'ichi
    • 東京大学大学院理学系研究科情報科学専攻 Department of Information Science, Graduate School of Science, University of Tokyo

Abstract

本稿では、日本語係り受け解析のための統計的手法について述べる。この手法は、統計値の計算方法が従来の手法と異なる。従来の手法では、2つの文節問が依存関係にある確率をそれぞれの文節の組に対して計算するが、本研究で提案する「3つ組/4つ組モデル」は、係り元の文節と係り先の文節の候補となる全ての文節に関する情報を確率の条件部として、ある文節が係り先として選択される確率を求める。なお、係り先の候補は、HPSGに基づいた文法及びヒューリスティクスによって高々3つに絞られる。確率の推定には最大エントロピー法を用いており、我々の構文解析器は耳DRコーパスに対して文節正解率88.6%という高い解析精度を達成した。

This paper describes a statistical method for Japanese dependency analysis. The method differs from conventional statistical models in the way of calculating statistical values. The conventional models calculate the probability of a correct dependency between two <I>bunsetsus</I> (phrasal units of Japanese) for each pair of <I>bunsetsus</I>. On the other hand, we propose the <I>triplet</I>/<I>quadruplet model</I>, in which the conditional part of the probability consists of information on a modifier <I>bunsetsu</I> and all its modification candidates, and the probability that a candidate is chosen as the modifiee is calculated. The number of candidates is restricted to three or less by an HPSG-based grammar and heuristics. With a maximum entropy estimation, our parser achieves high accuracy: 88.6% for the analysis of the EDR annotated corpus.

Journal

  • Journal of Natural Language Processing

    Journal of Natural Language Processing 7(5), 71-91, 2000-11-10

    The Association for Natural Language Processing

References:  19

Cited by:  8

Codes

  • NII Article ID (NAID)
    10008830134
  • NII NACSIS-CAT ID (NCID)
    AN10472659
  • Text Lang
    JPN
  • Article Type
    Journal Article
  • ISSN
    13407619
  • NDL Article ID
    5562177
  • NDL Call No.
    Z21-B168
  • Data Source
    CJP  CJPref  NDL  J-STAGE 
Page Top