多義解消のための構造規則の生成方法と日本語名詞句への適用  [in Japanese] Automatic Knowledge Acquisition for Disambiguation and Its' Application to Japanese Noun Phrases  [in Japanese]

Access this Article

Search this Article

Author(s)

    • 池原 悟 IKEHARA Satoru
    • 鳥取大学工学部知能情報工学科 Department of Information and Knowledge Engineering, Faculty of Engineering
    • 中井 慎司 NAKAI Shinji
    • 鳥取大学工学部知能情報工学科 Department of Information and Knowledge Engineering, Faculty of Engineering

Abstract

自然言語処理では, 処理の過程で, さまざまな解釈の曖昧さが生じる. この曖昧さを解消するのに必要な知識を記述するため, 対象とする表現を部分的な表現の組に還元せず, 一体として捉える方法として, 言語表現とその解釈の関係を変数とクラスの組からなる構造規則として表現し, 学習用標本から半自動的に収集する方法を提案した. この方法は, パターン化された表現の変数部分を表すのに文法属性体系と意味属性体系を使用しており, <I>N</I>個の変数を持つ表現パターンに対して, 一次元規則から<I>N</I>次元規則までの規則と字面からなる例外規則を合わせて<I>N</I>+1種類の構造規則が順に生成される点, また, 各規則は, その生成過程において, 各属性の意味的な包含関係を用いて容易に汎化される点に特徴がある. 本方式を「<I>A</I>の<I>B</I>の<I>C</I>」の型の名詞句に対する名詞間の係り受け解析規則の生成に適用した結果では, 変数部分を意味属性で表現した構造規則の場合, 1万件の学習事例から, 一次元規則198件, 二次元規則1480件, 三次元規則136件が得られ, それを使用した係り受け解析では, 約86%の解析精度が得られることが分かった. また, 変数部分を文法属性で表した規則と意味属性で表した規則を併用する場合は, 解析精度は, 1~2%向上することが分かった.この値は, 2名詞間の結合強度に還元して評価する方法 (72%) より約15%高い. この種の名詞句では, 人間でも係り先の判定に迷うような事例が10%近く存在することを考慮すると, 得られた規則の精度は, 人間の解析能力にかなり近い値と言える.

In order to represent the knowledge for resolving the syntactical and semantic ambiguities, structural rules and their generalization methods were proposed.In this method, the structural rules are composed of structure definition part and class definition part. The former is written by the set of any of almighty symbol, syntactic attributes, semantic attributes and word itself. From the view point of the number of parameters used for defining the expression structures, the rules are classified into one-dimensional rules, two-dimensional rules and so on, and automatically generated in this order from examples. Prominent feature of this method is in generalization methods. The generated rules are furthermore generalized based on the upper to lower relation of semantic attributes or syntactic attributes to reduce the number of rules without decreasing the performance. This method was applied to generate the dependency rules for Japanese expressions of “<I>A</I> no <I>B</I> no <I>C</I>” which are known as the most popular noun phrases which have hard ambiguities to be resolved. As the result, it was found that structural rules can easily be obtained by this method. The experimental results showed that the dependency relations can be determined at the accuracy of 86% by the rules obtained by this method. This rate is not so low compared to human ability for this kind of ambiguous noun phrases.

Journal

  • Journal of Natural Language Processing

    Journal of Natural Language Processing 8(1), 143-174, 2001-01-10

    The Association for Natural Language Processing

References:  42

Cited by:  2

Codes

  • NII Article ID (NAID)
    10008830320
  • NII NACSIS-CAT ID (NCID)
    AN10472659
  • Text Lang
    JPN
  • Article Type
    Journal Article
  • ISSN
    13407619
  • NDL Article ID
    5634418
  • NDL Call No.
    Z21-B168
  • Data Source
    CJP  CJPref  NDL  J-STAGE 
Page Top