統合的確率モデルを用いた日本語文解析
書誌事項
- タイトル別名
-
- Analysis of Japanese Sentences Using an Integrated Statistical Language Model
この論文をさがす
抄録
我々は構文的優先度, 語彙的従属関係を同時に取り扱う統合的確率言語モデルを提案している. このモデルの特長は構文的優先度と語彙的従属関係を互いに独立に取り扱う点にある. これにより, 両者を独立に学習することができるだけでなく, 両者がそれぞれ曖昧性解消にどれだけ有効に作用するのかを容易に評価できる. 本稿では, このモデルを用いて日本語文の係り受け解析実験を行った結果について報告し, 構文的優先度, 語彙的従属関係のそれぞれが文節の係り先の正解率の向上に大きく貢献することを示す. また, 解析に失敗した原因について調査を行い, その主な要因と本稿で提案するモデルにおける対処法について論ずる.
We propose a new statistical language model which integrates lexical association statistics with syntactic preferences, while maintaining the modularity of these different statistics types, facilitating both the training of the model and analysis of its behavior. In this paper, we report the results of an empirical evaluation of our model, in which the model is applied to the disambiguation of Japanese sentence dependency structures. The results show that both syntactic preferences and lexical associations significantly raise the accuracy, which is the ratio of the number of Bunsetu phrases whose modifiee is correctly identified, to the total phrase number. We also discuss further room for improvement based on our error analysis.
収録刊行物
-
- 情報処理学会研究報告. NL,自然言語処理研究会報告
-
情報処理学会研究報告. NL,自然言語処理研究会報告 122 43-50, 1997-11-20
一般社団法人情報処理学会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1573950401966936704
-
- NII論文ID
- 110002934605
-
- NII書誌ID
- AN10115061
-
- 本文言語コード
- en
-
- データソース種別
-
- CiNii Articles