節の始境界検出に基づく独話文の係り受け解析

書誌事項

タイトル別名
  • Dependency Parsing of Spoken Monologue Based on Clause-start Identification
  • 情報抽出、構造化

この論文をさがす

抄録

1文が長いという特徴を持つ独話文の高性能な係り受け解析を実現するため,節に分割し,節レベルと文レベルの2段階で係り受け解析を実行する枠組みが提案されており,その有効性が確認されている.しかし,上述の枠組みにおいては,節そのものに文を分割することはできないため,節の終境界で挟まれた単位(節境界単位)を解析の処理単位として用いており,そこでは解析単位の内部で係り受けが閉じない場合があることが問題となっていた.本論文では,節レベルと文レベルの2段階で解析を実行する枠組みに基づいて,節境界単位を拡張した完全に係り受けが閉じた単位を解析の処理単位とする係り受け解析手法を提案する.本手法では,ポーズや節境界タイプを考慮して,機械学習により節境界単位で閉じない係り受けの係り文節を検出し,この直後で節境界単位を再分割することにより,係り受けが閉じた単位を同定する.この単位を解析の処理単位として利用することにより,解析精度が改善されることを確認した.

A dependency parsing method based on sentence segmentation into clauses has been proposed and confirmed to be effective. In this method, dependency parsing is executed in two stages: at the clause level and the sentence level. However, since a sentence can not be segmented into complete clauses, in the past research, a unit sandwiched between two clause-end boundaries (clause boundary unit) is adapted as an approximate unit of the complete clause. There has been a problem that the dependency structure of the clause boundary unit is not necessarily closed. This paper proposes a method for dependency parsing based on sentece segmentation into units which corresponds to clauses and whose dependency structure is completely closed (clause fragment). Our method identifies such the unit by redividing a clause boundary unit at modifier bunsetsus of dependency relations over clause-end boundaries. As the results of the experiment, we confirmed the improvement of the dependency parsing accuracy by utilizing the clause fragment unit as a parsing unit.

収録刊行物

関連プロジェクト

もっと見る

詳細情報 詳細情報について

  • CRID
    1050282812857897600
  • NII論文ID
    110007970351
  • NII書誌ID
    AN00116647
  • ISSN
    18827764
  • Web Site
    http://id.nii.ac.jp/1001/00009274/
  • 本文言語コード
    ja
  • 資料種別
    journal article
  • データソース種別
    • IRDB
    • CiNii Articles
    • KAKEN

問題の指摘

ページトップへ