最尤先行詞候補を用いた日本語名詞句同一指示解析

書誌事項

タイトル別名
  • サイユウ センコウシ コウホ オ モチイタ ニホンゴ メイシク ドウイツ シジ カイセキ
  • Noun Phrase Coreference Resolution in Japanese Based on Most Likely Antecedent Candidates
  • 自然言語

この論文をさがす

抄録

日本語における名詞句の同一指示関係を同定するための新しい解析手法を提案する.従来の同一指示解析方法は定名詞か否かを判定する際に局所文脈の情報しか参照していないという問題や,非照応詞と先行詞候補との関係を訓練事例として抽出していないため,非照応詞が棄却されることが保証されないという問題が存在する.また,日本語の場合は,英語などの言語と比較して冠詞の情報がないため同一指示関係の解析の問題が難しくなると考えられる.そこで,本稿では,照応詞の候補に対して先行詞となる可能性のある候補を提示することで,より広い文脈の情報を参照して照応詞か否かの分類問題を解くための手法を提案する.この手法では,非照応詞に対しても最も先行詞らしい候補を見せることで極端に負例が多くならないという利点もある.この提案手法を用いて日本語名詞句同一指示関係の同定実験を行い,先行研究の機械学習を用いた手法より精度良く同一指示関係の同定ができたことを報告する.

We propose a new approach to coreference resolution in Japanese. In conventional approaches, noun phrases are classified as definite or not by referring only to information in the local context, and these approaches might not be able to reject non-anaphoric entities because the instances of the non-anaphoric entities and antecedent candidates are not extracted. Furthermore, resolving coreferential relations in Japanese is more difficult than in English because of the absence of articles. This paper proposes a model to resolve the classification problem of whether a candidate is truly an anaphor or not by referring to information from a much larger context. This model has an advantage of being able to reduce negative training instances by using the most likely antecedent candidate selected for a given non-anaphoric entity. Application of the proposed model to noun phrase coreference resolution showed that the model outperformed earlier machine learning-based models.

収録刊行物

被引用文献 (4)*注記

もっと見る

参考文献 (21)*注記

もっと見る

キーワード

詳細情報

問題の指摘

ページトップへ