アナロジーに基づく構文解析  [in Japanese] Analogy Based Approach on Linguistic Structure Analysis  [in Japanese]

Access this Article

Search this Article

Author(s)

Abstract

本稿では, ツリーバンクを用いて入力文と類似した文の構文木から入力文に対する構文木を類推する手法を提案する. この手法は用例に基づく解析手法の1つであるが, 統計情報や意味的類似性ではなく, 複数のツリーバンク内データの問で定義される特定の類似関係に基づいて構文解析を行う. 特にここではツリーバンク内の知識表現形式をそのまま使って構文解析を行うため, 比較的容易に他の解析手法との融合を考えることができる. またこの手法は辞書などを用いず, データ間の類似性のみに基づいて解析を行うため, 未知語などを含む入力に対しても頑健に働く. ここでは特に基本原理として働く類似関係の有効性を評価するためにPenn Treebankを用いて評価実験を行った. その結果, 単語の表層情報と品詞情報を用いることで解析可能な文の約70%が一意に正しく解析でき, また誤ったものについても比較的正解に似た構文木を出力することができた.

We present a linguistic structure analysis method using a treebank. This method falls under example-based approaches to natural language processing. It, however, analyzes an input sentence by analogy, which is based on a certain relationship among the input and similar sentences in treebank. Our method directly utilizes examples in a treebank, so it is easy to integrate the method with another parsing method and it may be helpful for disambiguation in parsing. In addition, the method goes without any dictionaries, so it can work robustly even if there are some unknown words in input sentences. Some experiments using Penn Treebank shows that correct analyses are produced for about 70% of input sentences, and the analyses similar to the correct ones are generated for other sentences.

Journal

  • Journal of Natural Language Processing

    Journal of Natural Language Processing 6(3), 127-143, 1999-04-10

    The Association for Natural Language Processing

References:  14

Codes

  • NII Article ID (NAID)
    10008829016
  • NII NACSIS-CAT ID (NCID)
    AN10472659
  • Text Lang
    JPN
  • Article Type
    ART
  • ISSN
    13407619
  • NDL Article ID
    4794719
  • NDL Call No.
    Z21-B168
  • Data Source
    CJP  NDL  J-STAGE 
Page Top