複数のパーザを利用した統計的部分係り受け解析

書誌事項

タイトル別名
  • フクスウ ノ パーザ オ リヨウ シタ トウケイテキ ブブン カカリ ウケ カイセキ
  • Committee-based Decision Making in Probabilistic Partial Parsing
  • 自然言語処理

この論文をさがす

抄録

我々はこれまでに,信頼のおける部分だけを出力し被覆率を犠牲とする代償として正解率を向上させる統計的部分解析手法の調査を進めてきた.本稿では,さらにこの考えに委員会方式という概念を統合した枠組みを提案し,その評価を行った.委員会方式とは,複数の解析器(委員)の出力解を組み合わせることにより解析精度の向上をはかる手法である.ここでは,各委員から得られる解析結果に基づき委員会で多数決により統計的部分解析を行うために,従来の基本的な委員会方式に次の3つの拡張を施した:(1)解析器(委員)が推定した係り受け確率を票の重みと見なして重みつきの票を投じる確率的投票,(2)委員間での票の重みの信頼性を標準化する重み標準化,(3)各係り文節に対して2位以下の係り先候補にも重みつきの票を投じる多重投票.既存の5つの統計的解析器を用いて,京大コーパスを対象データとする解析実験を行った.その結果,委員の組合せによって精度変化には多少の揺れがあるものの,総合的には提案した枠組みおよび3つの拡張が解析精度の向上に有効に作用する見通しを得た.

In this paper, we explored two new direction for the nextstep beyond the state of the art of statistical parsing: probabilisticpartial parsing and committee-based decision making.Probabilistic partial parsing makes only as an output partial parsetree that is probabilistically highly reliable. Committee-baseddecision making is to combine several outputs from differentsystems (parsers) to make a better decision.Aiming at this coupling, we present a general framework which havethree extensions against original basic framework to committee-baseddecision making.(1) probabilistic voting: a committee accepts probabilisticallypara-meterized votes as its input.(2) weight standardization: a committee provides a means forstandardizing original votes to guarantee reliability of them.(3) multiple voting: a committee allows a committee member tovote not only to the best-scored candidate but also to all otherpotential candidates.From the result of our experiments on the Kyoto japanese corpus, weshow that our presented framework have some contributions.

収録刊行物

被引用文献 (4)*注記

もっと見る

参考文献 (23)*注記

もっと見る

キーワード

詳細情報

問題の指摘

ページトップへ