アナロジーに基づく構文解析 Analogy Based Approach on Linguistic Structure Analysis

この論文にアクセスする

この論文をさがす

著者

抄録

本稿では, ツリーバンクを用いて入力文と類似した文の構文木から入力文に対する構文木を類推する手法を提案する. この手法は用例に基づく解析手法の1つであるが, 統計情報や意味的類似性ではなく, 複数のツリーバンク内データの問で定義される特定の類似関係に基づいて構文解析を行う. 特にここではツリーバンク内の知識表現形式をそのまま使って構文解析を行うため, 比較的容易に他の解析手法との融合を考えることができる. またこの手法は辞書などを用いず, データ間の類似性のみに基づいて解析を行うため, 未知語などを含む入力に対しても頑健に働く. ここでは特に基本原理として働く類似関係の有効性を評価するためにPenn Treebankを用いて評価実験を行った. その結果, 単語の表層情報と品詞情報を用いることで解析可能な文の約70%が一意に正しく解析でき, また誤ったものについても比較的正解に似た構文木を出力することができた.

We present a linguistic structure analysis method using a treebank. This method falls under example-based approaches to natural language processing. It, however, analyzes an input sentence by analogy, which is based on a certain relationship among the input and similar sentences in treebank. Our method directly utilizes examples in a treebank, so it is easy to integrate the method with another parsing method and it may be helpful for disambiguation in parsing. In addition, the method goes without any dictionaries, so it can work robustly even if there are some unknown words in input sentences. Some experiments using Penn Treebank shows that correct analyses are produced for about 70% of input sentences, and the analyses similar to the correct ones are generated for other sentences.

収録刊行物

  • 自然言語処理 = Journal of natural language processing

    自然言語処理 = Journal of natural language processing 6(3), 127-143, 1999-04-10

    一般社団法人 言語処理学会

参考文献:  14件中 1-14件 を表示

各種コード

  • NII論文ID(NAID)
    10008829016
  • NII書誌ID(NCID)
    AN10472659
  • 本文言語コード
    JPN
  • 資料種別
    ART
  • ISSN
    13407619
  • NDL 記事登録ID
    4794719
  • NDL 雑誌分類
    ZU8(書誌・図書館・一般年鑑--図書館・ドキュメンテーション・文書館)
  • NDL 請求記号
    Z21-B168
  • データ提供元
    CJP書誌  NDL  J-STAGE 
ページトップへ