長い日本語文における並列構造の推定

書誌事項

タイトル別名
  • A Method for Analyzing Conjunctive Structures in Japanese
  • 自然言語処理

この論文をさがす

抄録

日本語情報処理において未解決のまま放置されている問題の1つに 長い文を正しく構文解析することがほとんどできないという問題がある文が長くなる主な原因は 1文中に多くの内容が並列的に述べられているところにあるしたがって このような並列する構造を正しく認識できれば 長い文も短くすることができ 文の解析が正しくできる可能性が高くなる多くの文において 並列する部分は何らかの意味において類似しているそこで 文中の並列構造を類似した2つの文節列としてとらえ これをダイナミックプログラミングの手法によって発見することを実現した並列構造としては 名詞句の並列のほかに いわゆる連用中止法といわれている述語句の並列等を対象としたまず 日本語文を文節ごとに区切り すべての文節対について類似度を計算するそして 並列の存在を示す助詞や連用中止などの前後において バランスのとれた並列構造を優先すること 文を意味的に区切っているある種の表現をこえて並列の範囲が広がる可能性は少ないこと 並列構造の直後に「など」のような語が現れやすいこと 等を考慮に入れた上で 類似度の総和が最も大きい2つの文節列を求め これを並列構造の範囲とする方法を考案した180文に対して実験を行ったところ この方法によって82%の精度で並列構造を推定することができた

収録刊行物

被引用文献 (34)*注記

もっと見る

参考文献 (5)*注記

もっと見る

キーワード

詳細情報 詳細情報について

  • CRID
    1050282812864624256
  • NII論文ID
    110002723382
  • NII書誌ID
    AN00116647
  • ISSN
    18827764
  • Web Site
    http://id.nii.ac.jp/1001/00014648/
  • 本文言語コード
    ja
  • 資料種別
    journal article
  • データソース種別
    • IRDB
    • CiNii Articles

問題の指摘

ページトップへ